adi_dev_workflow 1.1.1 → 1.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (98) hide show
  1. package/bin/index.js +8 -8
  2. package/frameworks/agents/qa-staff-engineer.md +311 -311
  3. package/frameworks/agents/qa-validation-expert.md +458 -458
  4. package/frameworks/agents/tech-review-conformance.md +200 -200
  5. package/frameworks/commands/ministack/README.md +2 -0
  6. package/frameworks/commands/ministack/code-review.md +2 -0
  7. package/frameworks/commands/ministack/generate-intent.md +2 -0
  8. package/frameworks/commands/ministack/generate-scope.md +2 -0
  9. package/frameworks/commands/ministack/generate-tasks.md +2 -0
  10. package/frameworks/commands/ministack/generate-tech-direction.md +2 -0
  11. package/frameworks/commands/ministack/run-ministack-tasks.md +3 -0
  12. package/frameworks/commands/ministack/run-ministack-withlinear.md +2 -0
  13. package/frameworks/commands/ministack/status.md +2 -0
  14. package/frameworks/commands/sdd/code-review.md +2 -0
  15. package/frameworks/commands/sdd/generate-prd.md +2 -0
  16. package/frameworks/commands/sdd/generate-task-plan.md +2 -0
  17. package/frameworks/commands/sdd/generate-tech-direction.md +2 -0
  18. package/frameworks/commands/sdd/generate-tech-spec.md +2 -0
  19. package/frameworks/commands/sdd/generate-tests.md +2 -0
  20. package/frameworks/commands/sdd/run_tasks.md +3 -0
  21. package/frameworks/commands/sdd/run_tasks_withlinear.md +2 -0
  22. package/frameworks/commands/sdd/status.md +2 -0
  23. package/frameworks/commands/sdd/validate-sdd.md +2 -0
  24. package/frameworks/commands/sync-tasks-to-linear.md +2 -0
  25. package/frameworks/commands/taskcard/generate-taskcard.md +2 -0
  26. package/frameworks/commands/taskcard/run-taskcard.md +2 -0
  27. package/frameworks/config/ai-framework-config.yaml +112 -0
  28. package/frameworks/skills/ministack-tasks-expert/SKILL.md +204 -204
  29. package/frameworks/skills/ministack-tasks-expert/templates/task_plan_template.md +78 -78
  30. package/frameworks/skills/ministack-tasks-expert/templates/task_template.md +103 -103
  31. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/benchmark.json +99 -99
  32. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/benchmark.md +64 -64
  33. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/eval_metadata.json +12 -12
  34. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/with_skill/grading.json +32 -32
  35. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/with_skill/outputs/response.md +134 -134
  36. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/with_skill/outputs/transcript.md +68 -68
  37. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/with_skill/timing.json +5 -5
  38. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/without_skill/grading.json +32 -32
  39. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/without_skill/outputs/response.md +525 -525
  40. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/without_skill/outputs/transcript.md +30 -30
  41. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/without_skill/timing.json +5 -5
  42. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/eval_metadata.json +12 -12
  43. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/with_skill/grading.json +32 -32
  44. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/with_skill/outputs/response.md +1126 -1126
  45. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/with_skill/outputs/transcript.md +131 -131
  46. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/with_skill/timing.json +5 -5
  47. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/without_skill/grading.json +32 -32
  48. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/without_skill/outputs/response.md +452 -452
  49. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/without_skill/outputs/transcript.md +78 -78
  50. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-2-spec-simples/without_skill/timing.json +5 -5
  51. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/eval_metadata.json +12 -12
  52. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/with_skill/grading.json +32 -32
  53. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/with_skill/outputs/response.md +101 -101
  54. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/with_skill/outputs/transcript.md +133 -133
  55. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/with_skill/timing.json +5 -5
  56. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/without_skill/grading.json +32 -32
  57. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/without_skill/outputs/response.md +248 -248
  58. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/without_skill/outputs/transcript.md +49 -49
  59. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-3-sem-user-stories/without_skill/timing.json +5 -5
  60. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/review.html +1325 -1325
  61. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/benchmark.json +94 -94
  62. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/benchmark.md +67 -67
  63. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/eval_metadata.json +12 -12
  64. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/with_skill/grading.json +32 -32
  65. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/with_skill/outputs/response.md +117 -117
  66. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/with_skill/outputs/transcript.md +91 -91
  67. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/with_skill/timing.json +1 -1
  68. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/without_skill/grading.json +32 -32
  69. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/without_skill/outputs/response.md +694 -694
  70. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/without_skill/outputs/transcript.md +45 -45
  71. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-1-happy-path/without_skill/timing.json +1 -1
  72. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/eval_metadata.json +12 -12
  73. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/with_skill/grading.json +32 -32
  74. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/with_skill/outputs/response.md +1087 -1087
  75. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/with_skill/outputs/transcript.md +124 -124
  76. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/with_skill/timing.json +1 -1
  77. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/without_skill/grading.json +32 -32
  78. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/without_skill/outputs/response.md +458 -458
  79. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/without_skill/outputs/transcript.md +84 -84
  80. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-2-spec-simples/without_skill/timing.json +1 -1
  81. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/eval_metadata.json +12 -12
  82. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/with_skill/grading.json +32 -32
  83. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/with_skill/outputs/response.md +70 -70
  84. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/with_skill/outputs/transcript.md +148 -148
  85. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/with_skill/timing.json +1 -1
  86. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/without_skill/grading.json +32 -32
  87. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/without_skill/outputs/response.md +249 -249
  88. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/without_skill/outputs/transcript.md +80 -80
  89. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/eval-3-sem-user-stories/without_skill/timing.json +1 -1
  90. package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-2/review.html +1325 -1325
  91. package/frameworks/skills/sdd-tech-spec-expert/SKILL.md +317 -317
  92. package/frameworks/skills/sdd-tech-spec-expert/evals/evals.json +199 -199
  93. package/frameworks/skills/sdd-tech-spec-expert/templates/spec_tech_template.md +290 -290
  94. package/frameworks/skills/sdd-tech-spec-expert/templates/tech_direction-template.md +23 -23
  95. package/package.json +28 -28
  96. package/src/cli.js +121 -121
  97. package/src/installer.js +155 -136
  98. package/src/transformer.js +86 -86
@@ -1,133 +1,133 @@
1
- # Transcript — Tools Called
2
-
3
- ## Eval: eval-3-sem-user-stories (with_skill)
4
- ## Data: 2026-03-07
5
-
6
- ---
7
-
8
- ### 1. Read — Skill file e templates (paralelo)
9
-
10
- **Ferramentas chamadas em paralelo:**
11
-
12
- 1. `Read` — `.claude/skills/sdd-task-plan-expert/SKILL.md`
13
- - **Motivo**: Ler as instrucoes completas da skill para seguir o processo definido.
14
- - **Resultado**: Skill carregada com sucesso. Contem processo interativo, guardrails, templates, regras de rastreabilidade e estrutura de arquivos.
15
-
16
- 2. `Read` — `.claude/skills/sdd-task-plan-expert/templates/task_plan_template.md`
17
- - **Motivo**: Ler o template do TASK PLAN para saber a estrutura esperada.
18
- - **Resultado**: Template contem secoes: Identificacao, Objetivo, Macro-Fases, Lista de Tasks, Rastreabilidade US->Tasks, Dependencias, Criterios de Conclusao, Riscos, Checklist.
19
-
20
- 3. `Read` — `.claude/skills/sdd-task-plan-expert/templates/task_template.md`
21
- - **Motivo**: Ler o template da task individual para saber a estrutura detalhada.
22
- - **Resultado**: Template contem secoes: Identificacao, Objetivo, Descricao Detalhada, Aceite Tecnico, Arquivos Impactados, Testes, Notas, Checklist.
23
-
24
- ---
25
-
26
- ### 2. Glob — Explorar estrutura do codebase (paralelo)
27
-
28
- **Ferramentas chamadas em paralelo:**
29
-
30
- 1. `Glob` — `internal/**/*.go`
31
- - **Motivo**: Mapear todos os arquivos Go do projeto para entender a arquitetura existente.
32
- - **Resultado**: 17 arquivos encontrados cobrindo handler, service, repository, infra (config, database, di, grpc, logger).
33
-
34
- 2. `Glob` — `configs/*.yaml`
35
- - **Motivo**: Verificar arquivos de configuracao existentes.
36
- - **Resultado**: 1 arquivo: `configs/config.yaml`.
37
-
38
- 3. `Glob` — `internal/db/migrations/*.sql`
39
- - **Motivo**: Verificar migracoes existentes.
40
- - **Resultado**: 1 arquivo: `001_create_usuarios.sql`.
41
-
42
- 4. `Glob` — `internal/db/queries/*.sql`
43
- - **Motivo**: Verificar queries SQLC existentes.
44
- - **Resultado**: Nenhum arquivo encontrado (queries podem estar em outro local ou ainda nao existem como arquivos separados).
45
-
46
- ---
47
-
48
- ### 3. Read — Arquivos-chave do codebase (paralelo)
49
-
50
- **Ferramentas chamadas em paralelo:**
51
-
52
- 1. `Read` — `configs/config.yaml`
53
- - **Motivo**: Verificar estrutura atual da configuracao (onde `cache.ttl_seconds` sera adicionado).
54
- - **Resultado**: Config tem campos grpc, database, jwt, log. NAO tem campo cache.
55
-
56
- 2. `Read` — `internal/infra/config/config.go`
57
- - **Motivo**: Verificar struct Config e como novos campos sao adicionados.
58
- - **Resultado**: Struct Config com campos GRPCHost, GRPCPort, DatabasePath, JWTSecret, LogLevel. Usa Viper com env prefix APP_.
59
-
60
- 3. `Read` — `internal/infra/di/fx.go`
61
- - **Motivo**: Verificar composicao de modulos FX existente.
62
- - **Resultado**: AppModule compoe: config, logger, database, repository, service, grpchandler, grpcserver. NAO tem modulo cache.
63
-
64
- 4. `Read` — `internal/service/user_service.go`
65
- - **Motivo**: Entender padrao de service existente como referencia.
66
- - **Resultado**: Padrao: interface publica, struct privada, construtor, modulo FX inline.
67
-
68
- 5. `Read` — `internal/repository/user_repository.go`
69
- - **Motivo**: Entender padrao de repository existente como referencia.
70
- - **Resultado**: Padrao: struct de dominio, interface, implementacao com SQLC, mapeamento PT->EN, modulo FX.
71
-
72
- 6. `Read` — `internal/infra/grpc/server.go`
73
- - **Motivo**: Entender como handlers sao registrados no server gRPC.
74
- - **Resultado**: Server recebe handlers via FX params, registra com `pb.RegisterXxxServiceServer`.
75
-
76
- ---
77
-
78
- ### 4. Grep — Verificar existencia de modulo Produto e cache (paralelo)
79
-
80
- **Ferramentas chamadas em paralelo:**
81
-
82
- 1. `Grep` — pattern `product|produto|cardapio|cache` em `*.go`
83
- - **Motivo**: Verificar se existe qualquer codigo relacionado a produto ou cache.
84
- - **Resultado**: Apenas 1 match em logger.go (falso positivo). NAO existe modulo de produto nem cache.
85
-
86
- 2. `Grep` — pattern `product|produto|cardapio` em `*.proto`
87
- - **Motivo**: Verificar se existe proto de produto.
88
- - **Resultado**: Nenhum match. NAO existe proto de produto.
89
-
90
- 3. `Glob` — `internal/infra/cache/**/*`
91
- - **Motivo**: Verificar se pacote cache ja existe.
92
- - **Resultado**: Nenhum arquivo. Pacote NAO existe.
93
-
94
- 4. `Read` — `internal/service/user_service_test.go`
95
- - **Motivo**: Entender padrao de testes existente (framework, mocks, table-driven).
96
- - **Resultado**: Usa testify/mock, table-driven tests, MockUserRepository inline, assertNotCalled, assertNumberOfCalls.
97
-
98
- ---
99
-
100
- ### 5. Bash — Criar diretorio de output
101
-
102
- 1. `Bash` — `mkdir -p .../outputs`
103
- - **Motivo**: Criar estrutura de diretorios para salvar os arquivos de saida do eval.
104
- - **Resultado**: Diretorio criado com sucesso.
105
-
106
- ---
107
-
108
- ### 6. Write — Salvar response.md
109
-
110
- 1. `Write` — `.../outputs/response.md`
111
- - **Motivo**: Salvar a resposta completa da interacao inicial.
112
- - **Resultado**: Arquivo criado com: extracao do nome, analise do codebase, pergunta sobre US/PRD ausentes, pergunta sobre dependencia do modulo Produto, confirmacao pendente.
113
-
114
- ---
115
-
116
- ### 7. Write — Salvar transcript.md
117
-
118
- 1. `Write` — `.../outputs/transcript.md`
119
- - **Motivo**: Salvar o registro de todas as ferramentas chamadas.
120
- - **Resultado**: Este arquivo.
121
-
122
- ---
123
-
124
- ## Resumo
125
-
126
- | Ferramenta | Quantidade de chamadas | Motivo geral |
127
- |------------|----------------------|--------------|
128
- | Read | 9 | Skill, templates, arquivos do codebase |
129
- | Glob | 4 | Explorar estrutura do projeto |
130
- | Grep | 3 | Verificar existencia de produto/cache |
131
- | Bash | 1 | Criar diretorios de output |
132
- | Write | 2 | Salvar response.md e transcript.md |
133
- | **Total** | **19** | |
1
+ # Transcript — Tools Called
2
+
3
+ ## Eval: eval-3-sem-user-stories (with_skill)
4
+ ## Data: 2026-03-07
5
+
6
+ ---
7
+
8
+ ### 1. Read — Skill file e templates (paralelo)
9
+
10
+ **Ferramentas chamadas em paralelo:**
11
+
12
+ 1. `Read` — `.claude/skills/sdd-task-plan-expert/SKILL.md`
13
+ - **Motivo**: Ler as instrucoes completas da skill para seguir o processo definido.
14
+ - **Resultado**: Skill carregada com sucesso. Contem processo interativo, guardrails, templates, regras de rastreabilidade e estrutura de arquivos.
15
+
16
+ 2. `Read` — `.claude/skills/sdd-task-plan-expert/templates/task_plan_template.md`
17
+ - **Motivo**: Ler o template do TASK PLAN para saber a estrutura esperada.
18
+ - **Resultado**: Template contem secoes: Identificacao, Objetivo, Macro-Fases, Lista de Tasks, Rastreabilidade US->Tasks, Dependencias, Criterios de Conclusao, Riscos, Checklist.
19
+
20
+ 3. `Read` — `.claude/skills/sdd-task-plan-expert/templates/task_template.md`
21
+ - **Motivo**: Ler o template da task individual para saber a estrutura detalhada.
22
+ - **Resultado**: Template contem secoes: Identificacao, Objetivo, Descricao Detalhada, Aceite Tecnico, Arquivos Impactados, Testes, Notas, Checklist.
23
+
24
+ ---
25
+
26
+ ### 2. Glob — Explorar estrutura do codebase (paralelo)
27
+
28
+ **Ferramentas chamadas em paralelo:**
29
+
30
+ 1. `Glob` — `internal/**/*.go`
31
+ - **Motivo**: Mapear todos os arquivos Go do projeto para entender a arquitetura existente.
32
+ - **Resultado**: 17 arquivos encontrados cobrindo handler, service, repository, infra (config, database, di, grpc, logger).
33
+
34
+ 2. `Glob` — `configs/*.yaml`
35
+ - **Motivo**: Verificar arquivos de configuracao existentes.
36
+ - **Resultado**: 1 arquivo: `configs/config.yaml`.
37
+
38
+ 3. `Glob` — `internal/db/migrations/*.sql`
39
+ - **Motivo**: Verificar migracoes existentes.
40
+ - **Resultado**: 1 arquivo: `001_create_usuarios.sql`.
41
+
42
+ 4. `Glob` — `internal/db/queries/*.sql`
43
+ - **Motivo**: Verificar queries SQLC existentes.
44
+ - **Resultado**: Nenhum arquivo encontrado (queries podem estar em outro local ou ainda nao existem como arquivos separados).
45
+
46
+ ---
47
+
48
+ ### 3. Read — Arquivos-chave do codebase (paralelo)
49
+
50
+ **Ferramentas chamadas em paralelo:**
51
+
52
+ 1. `Read` — `configs/config.yaml`
53
+ - **Motivo**: Verificar estrutura atual da configuracao (onde `cache.ttl_seconds` sera adicionado).
54
+ - **Resultado**: Config tem campos grpc, database, jwt, log. NAO tem campo cache.
55
+
56
+ 2. `Read` — `internal/infra/config/config.go`
57
+ - **Motivo**: Verificar struct Config e como novos campos sao adicionados.
58
+ - **Resultado**: Struct Config com campos GRPCHost, GRPCPort, DatabasePath, JWTSecret, LogLevel. Usa Viper com env prefix APP_.
59
+
60
+ 3. `Read` — `internal/infra/di/fx.go`
61
+ - **Motivo**: Verificar composicao de modulos FX existente.
62
+ - **Resultado**: AppModule compoe: config, logger, database, repository, service, grpchandler, grpcserver. NAO tem modulo cache.
63
+
64
+ 4. `Read` — `internal/service/user_service.go`
65
+ - **Motivo**: Entender padrao de service existente como referencia.
66
+ - **Resultado**: Padrao: interface publica, struct privada, construtor, modulo FX inline.
67
+
68
+ 5. `Read` — `internal/repository/user_repository.go`
69
+ - **Motivo**: Entender padrao de repository existente como referencia.
70
+ - **Resultado**: Padrao: struct de dominio, interface, implementacao com SQLC, mapeamento PT->EN, modulo FX.
71
+
72
+ 6. `Read` — `internal/infra/grpc/server.go`
73
+ - **Motivo**: Entender como handlers sao registrados no server gRPC.
74
+ - **Resultado**: Server recebe handlers via FX params, registra com `pb.RegisterXxxServiceServer`.
75
+
76
+ ---
77
+
78
+ ### 4. Grep — Verificar existencia de modulo Produto e cache (paralelo)
79
+
80
+ **Ferramentas chamadas em paralelo:**
81
+
82
+ 1. `Grep` — pattern `product|produto|cardapio|cache` em `*.go`
83
+ - **Motivo**: Verificar se existe qualquer codigo relacionado a produto ou cache.
84
+ - **Resultado**: Apenas 1 match em logger.go (falso positivo). NAO existe modulo de produto nem cache.
85
+
86
+ 2. `Grep` — pattern `product|produto|cardapio` em `*.proto`
87
+ - **Motivo**: Verificar se existe proto de produto.
88
+ - **Resultado**: Nenhum match. NAO existe proto de produto.
89
+
90
+ 3. `Glob` — `internal/infra/cache/**/*`
91
+ - **Motivo**: Verificar se pacote cache ja existe.
92
+ - **Resultado**: Nenhum arquivo. Pacote NAO existe.
93
+
94
+ 4. `Read` — `internal/service/user_service_test.go`
95
+ - **Motivo**: Entender padrao de testes existente (framework, mocks, table-driven).
96
+ - **Resultado**: Usa testify/mock, table-driven tests, MockUserRepository inline, assertNotCalled, assertNumberOfCalls.
97
+
98
+ ---
99
+
100
+ ### 5. Bash — Criar diretorio de output
101
+
102
+ 1. `Bash` — `mkdir -p .../outputs`
103
+ - **Motivo**: Criar estrutura de diretorios para salvar os arquivos de saida do eval.
104
+ - **Resultado**: Diretorio criado com sucesso.
105
+
106
+ ---
107
+
108
+ ### 6. Write — Salvar response.md
109
+
110
+ 1. `Write` — `.../outputs/response.md`
111
+ - **Motivo**: Salvar a resposta completa da interacao inicial.
112
+ - **Resultado**: Arquivo criado com: extracao do nome, analise do codebase, pergunta sobre US/PRD ausentes, pergunta sobre dependencia do modulo Produto, confirmacao pendente.
113
+
114
+ ---
115
+
116
+ ### 7. Write — Salvar transcript.md
117
+
118
+ 1. `Write` — `.../outputs/transcript.md`
119
+ - **Motivo**: Salvar o registro de todas as ferramentas chamadas.
120
+ - **Resultado**: Este arquivo.
121
+
122
+ ---
123
+
124
+ ## Resumo
125
+
126
+ | Ferramenta | Quantidade de chamadas | Motivo geral |
127
+ |------------|----------------------|--------------|
128
+ | Read | 9 | Skill, templates, arquivos do codebase |
129
+ | Glob | 4 | Explorar estrutura do projeto |
130
+ | Grep | 3 | Verificar existencia de produto/cache |
131
+ | Bash | 1 | Criar diretorios de output |
132
+ | Write | 2 | Salvar response.md e transcript.md |
133
+ | **Total** | **19** | |
@@ -1,5 +1,5 @@
1
- {
2
- "total_tokens": 43263,
3
- "duration_ms": 129986,
4
- "total_duration_seconds": 130.0
5
- }
1
+ {
2
+ "total_tokens": 43263,
3
+ "duration_ms": 129986,
4
+ "total_duration_seconds": 130.0
5
+ }
@@ -1,32 +1,32 @@
1
- {
2
- "eval_id": 3,
3
- "eval_name": "spec-tech-sem-user-stories-explicitas",
4
- "configuration": "without_skill",
5
- "expectations": [
6
- {
7
- "text": "Detecta a ausencia de User Stories (US-XX) e PRD referenciado no SPEC_TECH",
8
- "passed": true,
9
- "evidence": "Secao 2 'Observacoes Preliminares' nota: 'O SPEC_TECH nao referencia User Stories nem PRD.' Tambem detectou que o modulo Product nao existe."
10
- },
11
- {
12
- "text": "PERGUNTA ao usuario sobre User Stories / PRD em vez de inventar ou ignorar",
13
- "passed": false,
14
- "evidence": "Nao perguntou ao usuario. Apenas notou a ausencia como observacao e prosseguiu gerando o plano completo com 5 tasks sem interacao."
15
- },
16
- {
17
- "text": "NAO inventa User Stories ficticias (guardrail: nunca invente informacoes)",
18
- "passed": true,
19
- "evidence": "Nao inventou User Stories. Derivou criterios diretamente do SPEC_TECH."
20
- },
21
- {
22
- "text": "Extrai corretamente o nome da feature como 'cache-de-cardapio' ou similar em kebab-case",
23
- "passed": false,
24
- "evidence": "Usou 'Cache de Cardapio em Memoria' como titulo mas nao normalizou para kebab-case. Nenhuma convencao de nomenclatura aplicada."
25
- },
26
- {
27
- "text": "Segue o processo interativo (uma pergunta por vez, confirma nome antes de prosseguir)",
28
- "passed": false,
29
- "evidence": "Nenhum processo interativo. Gerou o plano completo em um unico turno sem perguntas ao usuario."
30
- }
31
- ]
32
- }
1
+ {
2
+ "eval_id": 3,
3
+ "eval_name": "spec-tech-sem-user-stories-explicitas",
4
+ "configuration": "without_skill",
5
+ "expectations": [
6
+ {
7
+ "text": "Detecta a ausencia de User Stories (US-XX) e PRD referenciado no SPEC_TECH",
8
+ "passed": true,
9
+ "evidence": "Secao 2 'Observacoes Preliminares' nota: 'O SPEC_TECH nao referencia User Stories nem PRD.' Tambem detectou que o modulo Product nao existe."
10
+ },
11
+ {
12
+ "text": "PERGUNTA ao usuario sobre User Stories / PRD em vez de inventar ou ignorar",
13
+ "passed": false,
14
+ "evidence": "Nao perguntou ao usuario. Apenas notou a ausencia como observacao e prosseguiu gerando o plano completo com 5 tasks sem interacao."
15
+ },
16
+ {
17
+ "text": "NAO inventa User Stories ficticias (guardrail: nunca invente informacoes)",
18
+ "passed": true,
19
+ "evidence": "Nao inventou User Stories. Derivou criterios diretamente do SPEC_TECH."
20
+ },
21
+ {
22
+ "text": "Extrai corretamente o nome da feature como 'cache-de-cardapio' ou similar em kebab-case",
23
+ "passed": false,
24
+ "evidence": "Usou 'Cache de Cardapio em Memoria' como titulo mas nao normalizou para kebab-case. Nenhuma convencao de nomenclatura aplicada."
25
+ },
26
+ {
27
+ "text": "Segue o processo interativo (uma pergunta por vez, confirma nome antes de prosseguir)",
28
+ "passed": false,
29
+ "evidence": "Nenhum processo interativo. Gerou o plano completo em um unico turno sem perguntas ao usuario."
30
+ }
31
+ ]
32
+ }