@luanpdd/kit-mcp 1.32.0 → 1.34.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (376) hide show
  1. package/LICENSE +21 -21
  2. package/README.md +168 -168
  3. package/gates/agent-no-recursive-dispatch.md +84 -84
  4. package/kit/COMANDOS.md +138 -138
  5. package/kit/COMPATIBILITY.md +70 -70
  6. package/kit/README.md +76 -76
  7. package/kit/agents/advisor-researcher.md +109 -109
  8. package/kit/agents/ai-mutation-tester.md +289 -289
  9. package/kit/agents/assumptions-analyzer.md +110 -110
  10. package/kit/agents/audit-log-implementer.md +314 -314
  11. package/kit/agents/auditor-consistencia-isolamento.md +414 -414
  12. package/kit/agents/b2b-saas-architect.md +157 -157
  13. package/kit/agents/burn-rate-forecaster.md +153 -153
  14. package/kit/agents/cascading-failures-auditor.md +299 -299
  15. package/kit/agents/codebase-mapper.md +769 -769
  16. package/kit/agents/crm-pipeline-implementer.md +257 -257
  17. package/kit/agents/debugger.md +814 -814
  18. package/kit/agents/designer-ui.md +216 -0
  19. package/kit/agents/detector-tenant-quente.md +338 -338
  20. package/kit/agents/evolution-go-integrator.md +201 -201
  21. package/kit/agents/example-reviewer.md +22 -22
  22. package/kit/agents/executor.md +565 -565
  23. package/kit/agents/golden-signals-instrumenter.md +232 -232
  24. package/kit/agents/incident-investigator.md +238 -238
  25. package/kit/agents/integration-checker.md +203 -203
  26. package/kit/agents/invite-flow-implementer.md +190 -190
  27. package/kit/agents/legacy-characterizer.md +369 -369
  28. package/kit/agents/lgpd-compliance-auditor.md +296 -296
  29. package/kit/agents/load-shedding-instrumenter.md +290 -290
  30. package/kit/agents/multi-tenant-isolation-auditor.md +254 -254
  31. package/kit/agents/multi-tenant-rls-writer.md +341 -341
  32. package/kit/agents/nyquist-auditor.md +181 -181
  33. package/kit/agents/observability-coverage-auditor.md +316 -316
  34. package/kit/agents/observability-instrumenter.md +191 -191
  35. package/kit/agents/omm-auditor.md +291 -291
  36. package/kit/agents/org-onboarding-implementer.md +224 -224
  37. package/kit/agents/payload-capture-instrumenter.md +274 -274
  38. package/kit/agents/phase-researcher.md +697 -697
  39. package/kit/agents/plan-checker.md +275 -275
  40. package/kit/agents/planner.md +923 -923
  41. package/kit/agents/postmortem-writer.md +273 -273
  42. package/kit/agents/project-researcher.md +653 -653
  43. package/kit/agents/prr-conductor.md +287 -287
  44. package/kit/agents/refactor-safety-auditor.md +405 -405
  45. package/kit/agents/release-pipeline-auditor.md +364 -364
  46. package/kit/agents/research-synthesizer.md +246 -246
  47. package/kit/agents/roadmapper.md +678 -678
  48. package/kit/agents/schema-checker.md +160 -160
  49. package/kit/agents/seam-finder.md +360 -360
  50. package/kit/agents/shotgun-surgery-detector.md +350 -350
  51. package/kit/agents/slo-engineer.md +217 -217
  52. package/kit/agents/storytelling-analyst.md +300 -300
  53. package/kit/agents/supabase-architect.md +249 -249
  54. package/kit/agents/supabase-auth-bootstrapper.md +400 -400
  55. package/kit/agents/supabase-auth-hook-writer.md +418 -418
  56. package/kit/agents/supabase-branching-architect.md +563 -563
  57. package/kit/agents/supabase-cicd-pipeline-implementer.md +778 -778
  58. package/kit/agents/supabase-column-privileges-writer.md +400 -400
  59. package/kit/agents/supabase-edge-fn-tester.md +288 -288
  60. package/kit/agents/supabase-edge-fn-writer.md +341 -341
  61. package/kit/agents/supabase-mfa-implementer.md +439 -439
  62. package/kit/agents/supabase-migration-writer.md +386 -386
  63. package/kit/agents/supabase-oauth-server-implementer.md +507 -507
  64. package/kit/agents/supabase-rbac-implementer.md +393 -393
  65. package/kit/agents/supabase-realtime-implementer.md +364 -364
  66. package/kit/agents/supabase-rls-hardener.md +522 -522
  67. package/kit/agents/supabase-rls-writer.md +324 -324
  68. package/kit/agents/supabase-roles-implementer.md +356 -356
  69. package/kit/agents/supabase-social-auth-implementer.md +451 -451
  70. package/kit/agents/supabase-sso-saml-architect.md +549 -549
  71. package/kit/agents/supabase-storage-implementer.md +407 -407
  72. package/kit/agents/super-admin-implementer.md +282 -282
  73. package/kit/agents/toil-auditor.md +268 -268
  74. package/kit/agents/ui-auditor.md +438 -438
  75. package/kit/agents/ui-checker.md +305 -305
  76. package/kit/agents/ui-researcher.md +356 -356
  77. package/kit/agents/user-profiler.md +176 -176
  78. package/kit/agents/validador-evolucao-schema.md +336 -336
  79. package/kit/agents/verifier.md +729 -729
  80. package/kit/commands/adicionar-backlog.md +75 -75
  81. package/kit/commands/adicionar-fase.md +42 -42
  82. package/kit/commands/adicionar-tarefa.md +45 -45
  83. package/kit/commands/adicionar-testes.md +41 -41
  84. package/kit/commands/ajuda.md +21 -21
  85. package/kit/commands/atualizar.md +37 -37
  86. package/kit/commands/auditar-cascading.md +111 -111
  87. package/kit/commands/auditar-marco.md +179 -179
  88. package/kit/commands/auditar-observabilidade-cobertura-workflow.md +121 -0
  89. package/kit/commands/auditar-observabilidade-cobertura.md +183 -183
  90. package/kit/commands/auditar-refactor.md +219 -219
  91. package/kit/commands/auditar-release.md +109 -109
  92. package/kit/commands/auditar-uat.md +23 -23
  93. package/kit/commands/autonomo.md +40 -40
  94. package/kit/commands/branch-pr.md +24 -24
  95. package/kit/commands/burn-rate-status.md +408 -408
  96. package/kit/commands/capturar-payloads.md +193 -193
  97. package/kit/commands/caracterizar.md +212 -212
  98. package/kit/commands/concluir-marco.md +247 -247
  99. package/kit/commands/configuracoes.md +36 -36
  100. package/kit/commands/dados-distribuidos.md +188 -188
  101. package/kit/commands/definir-perfil.md +10 -10
  102. package/kit/commands/depurar.md +190 -190
  103. package/kit/commands/detectar-duplicacao.md +197 -197
  104. package/kit/commands/discutir-fase.md +131 -131
  105. package/kit/commands/encontrar-seams.md +136 -136
  106. package/kit/commands/entrar-discord.md +17 -17
  107. package/kit/commands/estatisticas.md +18 -18
  108. package/kit/commands/example-greeting.md +33 -33
  109. package/kit/commands/executar-fase.md +58 -58
  110. package/kit/commands/expresso.md +56 -56
  111. package/kit/commands/fase-ui.md +34 -34
  112. package/kit/commands/fazer.md +57 -57
  113. package/kit/commands/fio.md +125 -125
  114. package/kit/commands/fluxos-trabalho.md +64 -64
  115. package/kit/commands/forense.md +176 -176
  116. package/kit/commands/gerenciador.md +38 -38
  117. package/kit/commands/inserir-fase.md +31 -31
  118. package/kit/commands/legacy.md +263 -263
  119. package/kit/commands/limpeza.md +17 -17
  120. package/kit/commands/listar-hipoteses-fase.md +45 -45
  121. package/kit/commands/listar-workspaces.md +18 -18
  122. package/kit/commands/load-shedding.md +117 -117
  123. package/kit/commands/mapear-codebase.md +70 -70
  124. package/kit/commands/multi-tenant.md +163 -163
  125. package/kit/commands/nota.md +33 -33
  126. package/kit/commands/novo-marco.md +43 -43
  127. package/kit/commands/novo-projeto.md +41 -41
  128. package/kit/commands/novo-workspace.md +43 -43
  129. package/kit/commands/pausar-trabalho.md +37 -37
  130. package/kit/commands/perfil-usuario.md +45 -45
  131. package/kit/commands/pesquisar-fase.md +195 -195
  132. package/kit/commands/planejar-fase.md +67 -67
  133. package/kit/commands/planejar-lacunas.md +33 -33
  134. package/kit/commands/plantar-ideia.md +25 -25
  135. package/kit/commands/progresso.md +24 -24
  136. package/kit/commands/proximo.md +30 -30
  137. package/kit/commands/publicar.md +490 -490
  138. package/kit/commands/rapido.md +35 -35
  139. package/kit/commands/reaplicar-patches.md +124 -124
  140. package/kit/commands/refactor-seguro.md +321 -321
  141. package/kit/commands/relatorio-sessao.md +19 -19
  142. package/kit/commands/remover-fase.md +31 -31
  143. package/kit/commands/remover-workspace.md +26 -26
  144. package/kit/commands/resumo-marco.md +50 -50
  145. package/kit/commands/retomar-trabalho.md +40 -40
  146. package/kit/commands/revisar-backlog.md +60 -60
  147. package/kit/commands/revisar-ui.md +32 -32
  148. package/kit/commands/revisar.md +37 -37
  149. package/kit/commands/saude.md +21 -21
  150. package/kit/commands/setup-notion.md +93 -93
  151. package/kit/commands/storytelling.md +179 -179
  152. package/kit/commands/supabase.md +238 -238
  153. package/kit/commands/sync-main.md +68 -68
  154. package/kit/commands/validar-fase.md +35 -35
  155. package/kit/commands/verificar-tarefas.md +44 -44
  156. package/kit/commands/verificar-trabalho.md +64 -64
  157. package/kit/file-manifest.json +13 -3
  158. package/kit/framework/bin/lib/commands.cjs +959 -959
  159. package/kit/framework/bin/lib/config.cjs +442 -442
  160. package/kit/framework/bin/lib/core.cjs +1230 -1230
  161. package/kit/framework/bin/lib/frontmatter.cjs +336 -336
  162. package/kit/framework/bin/lib/init.cjs +1442 -1442
  163. package/kit/framework/bin/lib/milestone.cjs +252 -252
  164. package/kit/framework/bin/lib/model-profiles.cjs +68 -68
  165. package/kit/framework/bin/lib/phase.cjs +888 -888
  166. package/kit/framework/bin/lib/profile-output.cjs +952 -952
  167. package/kit/framework/bin/lib/profile-pipeline.cjs +539 -539
  168. package/kit/framework/bin/lib/roadmap.cjs +329 -329
  169. package/kit/framework/bin/lib/security.cjs +382 -382
  170. package/kit/framework/bin/lib/state.cjs +1031 -1031
  171. package/kit/framework/bin/lib/template.cjs +222 -222
  172. package/kit/framework/bin/lib/uat.cjs +282 -282
  173. package/kit/framework/bin/lib/verify.cjs +888 -888
  174. package/kit/framework/bin/lib/workstream.cjs +491 -491
  175. package/kit/framework/bin/tools.cjs +918 -918
  176. package/kit/framework/commands/workstreams.md +63 -63
  177. package/kit/framework/references/checkpoints.md +778 -778
  178. package/kit/framework/references/continuation-format.md +249 -249
  179. package/kit/framework/references/decimal-phase-calculation.md +64 -64
  180. package/kit/framework/references/git-integration.md +295 -295
  181. package/kit/framework/references/git-planning-commit.md +38 -38
  182. package/kit/framework/references/model-profile-resolution.md +36 -36
  183. package/kit/framework/references/model-profiles.md +139 -139
  184. package/kit/framework/references/phase-argument-parsing.md +61 -61
  185. package/kit/framework/references/planning-config.md +202 -202
  186. package/kit/framework/references/questioning.md +162 -162
  187. package/kit/framework/references/tdd.md +263 -263
  188. package/kit/framework/references/ui-brand.md +160 -160
  189. package/kit/framework/references/user-profiling.md +657 -657
  190. package/kit/framework/references/verification-patterns.md +612 -612
  191. package/kit/framework/references/workstream-flag.md +58 -58
  192. package/kit/framework/templates/DEBUG.md +164 -164
  193. package/kit/framework/templates/UAT.md +265 -265
  194. package/kit/framework/templates/UI-SPEC.md +100 -100
  195. package/kit/framework/templates/VALIDATION.md +76 -76
  196. package/kit/framework/templates/claude-md.md +122 -122
  197. package/kit/framework/templates/codebase/architecture.md +185 -185
  198. package/kit/framework/templates/codebase/concerns.md +205 -205
  199. package/kit/framework/templates/codebase/conventions.md +204 -204
  200. package/kit/framework/templates/codebase/integrations.md +192 -192
  201. package/kit/framework/templates/codebase/stack.md +158 -158
  202. package/kit/framework/templates/codebase/structure.md +199 -199
  203. package/kit/framework/templates/codebase/testing.md +301 -301
  204. package/kit/framework/templates/config.json +44 -44
  205. package/kit/framework/templates/context.md +352 -352
  206. package/kit/framework/templates/continue-here.md +78 -78
  207. package/kit/framework/templates/copilot-instructions.md +7 -7
  208. package/kit/framework/templates/debug-subagent-prompt.md +91 -91
  209. package/kit/framework/templates/dev-preferences.md +20 -20
  210. package/kit/framework/templates/discovery.md +146 -146
  211. package/kit/framework/templates/discussion-log.md +63 -63
  212. package/kit/framework/templates/milestone-archive.md +123 -123
  213. package/kit/framework/templates/milestone.md +115 -115
  214. package/kit/framework/templates/phase-prompt.md +610 -610
  215. package/kit/framework/templates/planner-subagent-prompt.md +117 -117
  216. package/kit/framework/templates/project.md +186 -186
  217. package/kit/framework/templates/requirements.md +231 -231
  218. package/kit/framework/templates/research-project/ARCHITECTURE.md +204 -204
  219. package/kit/framework/templates/research-project/FEATURES.md +147 -147
  220. package/kit/framework/templates/research-project/PITFALLS.md +200 -200
  221. package/kit/framework/templates/research-project/STACK.md +120 -120
  222. package/kit/framework/templates/research-project/SUMMARY.md +170 -170
  223. package/kit/framework/templates/research.md +419 -419
  224. package/kit/framework/templates/retrospective.md +54 -54
  225. package/kit/framework/templates/roadmap.md +202 -202
  226. package/kit/framework/templates/state.md +176 -176
  227. package/kit/framework/templates/summary-complex.md +59 -59
  228. package/kit/framework/templates/summary-minimal.md +41 -41
  229. package/kit/framework/templates/summary-standard.md +48 -48
  230. package/kit/framework/templates/summary.md +209 -209
  231. package/kit/framework/templates/user-profile.md +146 -146
  232. package/kit/framework/templates/user-setup.md +256 -256
  233. package/kit/framework/templates/verification-report.md +258 -258
  234. package/kit/framework/workflows/add-phase.md +112 -112
  235. package/kit/framework/workflows/add-tests.md +351 -351
  236. package/kit/framework/workflows/add-todo.md +158 -158
  237. package/kit/framework/workflows/audit-milestone.md +340 -340
  238. package/kit/framework/workflows/audit-uat.md +109 -109
  239. package/kit/framework/workflows/autonomous.md +891 -891
  240. package/kit/framework/workflows/check-todos.md +177 -177
  241. package/kit/framework/workflows/cleanup.md +152 -152
  242. package/kit/framework/workflows/complete-milestone.md +696 -696
  243. package/kit/framework/workflows/diagnose-issues.md +231 -231
  244. package/kit/framework/workflows/discovery-phase.md +289 -289
  245. package/kit/framework/workflows/discuss-phase-assumptions.md +653 -653
  246. package/kit/framework/workflows/discuss-phase.md +784 -784
  247. package/kit/framework/workflows/do.md +104 -104
  248. package/kit/framework/workflows/execute-phase.md +838 -838
  249. package/kit/framework/workflows/execute-plan.md +510 -510
  250. package/kit/framework/workflows/fast.md +102 -102
  251. package/kit/framework/workflows/forensics.md +265 -265
  252. package/kit/framework/workflows/health.md +181 -181
  253. package/kit/framework/workflows/help.md +619 -619
  254. package/kit/framework/workflows/insert-phase.md +130 -130
  255. package/kit/framework/workflows/list-phase-assumptions.md +178 -178
  256. package/kit/framework/workflows/list-workspaces.md +56 -56
  257. package/kit/framework/workflows/manager.md +362 -362
  258. package/kit/framework/workflows/map-codebase.md +377 -377
  259. package/kit/framework/workflows/milestone-summary.md +223 -223
  260. package/kit/framework/workflows/new-milestone.md +486 -486
  261. package/kit/framework/workflows/new-project.md +1159 -1159
  262. package/kit/framework/workflows/new-workspace.md +237 -237
  263. package/kit/framework/workflows/next.md +97 -97
  264. package/kit/framework/workflows/node-repair.md +92 -92
  265. package/kit/framework/workflows/note.md +156 -156
  266. package/kit/framework/workflows/pause-work.md +176 -176
  267. package/kit/framework/workflows/plan-milestone-gaps.md +273 -273
  268. package/kit/framework/workflows/plan-phase.md +765 -765
  269. package/kit/framework/workflows/plant-seed.md +169 -169
  270. package/kit/framework/workflows/pr-branch.md +129 -129
  271. package/kit/framework/workflows/profile-user.md +450 -450
  272. package/kit/framework/workflows/progress.md +507 -507
  273. package/kit/framework/workflows/quick.md +757 -757
  274. package/kit/framework/workflows/remove-phase.md +155 -155
  275. package/kit/framework/workflows/remove-workspace.md +90 -90
  276. package/kit/framework/workflows/research-phase.md +82 -82
  277. package/kit/framework/workflows/resume-project.md +326 -326
  278. package/kit/framework/workflows/review.md +228 -228
  279. package/kit/framework/workflows/session-report.md +146 -146
  280. package/kit/framework/workflows/settings.md +283 -283
  281. package/kit/framework/workflows/ship.md +228 -228
  282. package/kit/framework/workflows/stats.md +60 -60
  283. package/kit/framework/workflows/transition.md +671 -671
  284. package/kit/framework/workflows/ui-phase.md +302 -302
  285. package/kit/framework/workflows/ui-review.md +165 -165
  286. package/kit/framework/workflows/update.md +323 -323
  287. package/kit/framework/workflows/validate-phase.md +174 -174
  288. package/kit/framework/workflows/verify-phase.md +252 -252
  289. package/kit/framework/workflows/verify-work.md +637 -637
  290. package/kit/hooks/check-update.js +118 -118
  291. package/kit/hooks/context-monitor.js +163 -163
  292. package/kit/hooks/kit-attribution-reminder.cjs +92 -92
  293. package/kit/hooks/kit-router.cjs +137 -137
  294. package/kit/hooks/prompt-guard.js +103 -103
  295. package/kit/hooks/statusline.js +125 -125
  296. package/kit/hooks/workflow-guard.js +101 -101
  297. package/kit/settings.json +45 -45
  298. package/kit/skills/ai-prompt-characterization/SKILL.md +335 -335
  299. package/kit/skills/armadilhas-sistemas-distribuidos/SKILL.md +447 -447
  300. package/kit/skills/audit-log-multi-tenant/SKILL.md +340 -340
  301. package/kit/skills/b2b-saas-architecture/SKILL.md +300 -300
  302. package/kit/skills/consistencia-leitura-replica/SKILL.md +385 -385
  303. package/kit/skills/crm-lead-pipeline-patterns/SKILL.md +343 -343
  304. package/kit/skills/escolha-modelo-consistencia/SKILL.md +494 -494
  305. package/kit/skills/evolucao-schema-compativel/SKILL.md +448 -448
  306. package/kit/skills/evolution-go-whatsapp-integration/SKILL.md +322 -322
  307. package/kit/skills/example-skill/SKILL.md +42 -42
  308. package/kit/skills/legacy-api-only-applications/SKILL.md +358 -358
  309. package/kit/skills/legacy-characterization-tests/SKILL.md +330 -330
  310. package/kit/skills/legacy-effect-analysis/SKILL.md +331 -331
  311. package/kit/skills/legacy-extract-class/SKILL.md +203 -203
  312. package/kit/skills/legacy-programming-by-difference/SKILL.md +252 -252
  313. package/kit/skills/legacy-seams-and-test-harness/SKILL.md +460 -460
  314. package/kit/skills/legacy-shotgun-surgery/SKILL.md +286 -286
  315. package/kit/skills/legacy-sprout-wrap-techniques/SKILL.md +434 -434
  316. package/kit/skills/legacy-storytelling-naked-crc/SKILL.md +270 -270
  317. package/kit/skills/lgpd-multi-tenant-compliance/SKILL.md +340 -340
  318. package/kit/skills/member-invite-flow/SKILL.md +305 -305
  319. package/kit/skills/member-management-react-shadcn/SKILL.md +328 -328
  320. package/kit/skills/multi-tenant-performance-scaling/SKILL.md +316 -316
  321. package/kit/skills/multi-tenant-rls-hierarchy/SKILL.md +342 -342
  322. package/kit/skills/org-onboarding-flow/SKILL.md +257 -257
  323. package/kit/skills/org-switcher-react-pattern/SKILL.md +349 -349
  324. package/kit/skills/permission-gate-react-pattern/SKILL.md +271 -271
  325. package/kit/skills/postgres-isolamento-concorrencia/SKILL.md +552 -552
  326. package/kit/skills/pre-refactor-characterization/SKILL.md +421 -421
  327. package/kit/skills/rbac-permissions-matrix-supabase/SKILL.md +338 -338
  328. package/kit/skills/streams-eventos-cdc/SKILL.md +711 -711
  329. package/kit/skills/supabase-auth-hardening/SKILL.md +674 -674
  330. package/kit/skills/supabase-auth-hooks/SKILL.md +875 -875
  331. package/kit/skills/supabase-auth-methods/SKILL.md +486 -486
  332. package/kit/skills/supabase-auth-sessions/SKILL.md +579 -579
  333. package/kit/skills/supabase-auth-ssr/SKILL.md +306 -306
  334. package/kit/skills/supabase-branching-workflow/SKILL.md +544 -544
  335. package/kit/skills/supabase-ci-cd-github-actions/SKILL.md +880 -880
  336. package/kit/skills/supabase-column-level-security/SKILL.md +426 -426
  337. package/kit/skills/supabase-config-toml-remotes/SKILL.md +807 -807
  338. package/kit/skills/supabase-custom-claims-rbac/SKILL.md +472 -472
  339. package/kit/skills/supabase-edge-functions/SKILL.md +330 -330
  340. package/kit/skills/supabase-edge-functions-auth/SKILL.md +309 -309
  341. package/kit/skills/supabase-edge-functions-limits/SKILL.md +302 -302
  342. package/kit/skills/supabase-edge-functions-mcp-server/SKILL.md +279 -279
  343. package/kit/skills/supabase-edge-functions-testing/SKILL.md +277 -277
  344. package/kit/skills/supabase-edge-runtime-builtins/SKILL.md +357 -357
  345. package/kit/skills/supabase-enterprise-sso-saml/SKILL.md +545 -545
  346. package/kit/skills/supabase-jwt-signing-keys/SKILL.md +399 -399
  347. package/kit/skills/supabase-mfa/SKILL.md +488 -488
  348. package/kit/skills/supabase-migration-repair/SKILL.md +823 -823
  349. package/kit/skills/supabase-migrations/SKILL.md +297 -297
  350. package/kit/skills/supabase-oauth-server/SKILL.md +537 -537
  351. package/kit/skills/supabase-pgtap-testing/SKILL.md +1053 -1053
  352. package/kit/skills/supabase-postgres-roles/SKILL.md +392 -392
  353. package/kit/skills/supabase-realtime/SKILL.md +460 -460
  354. package/kit/skills/supabase-rls-defense-in-depth/SKILL.md +418 -418
  355. package/kit/skills/supabase-rls-policies/SKILL.md +635 -635
  356. package/kit/skills/supabase-social-oauth/SKILL.md +480 -480
  357. package/kit/skills/supabase-third-party-auth/SKILL.md +450 -450
  358. package/kit/skills/super-admin-platform-pattern/SKILL.md +326 -326
  359. package/kit/skills/tenant-quente-mitigacao/SKILL.md +605 -605
  360. package/kit/skills/ui-anti-padroes-ia/SKILL.md +261 -0
  361. package/kit/skills/ui-contexto-produto/SKILL.md +248 -0
  362. package/kit/skills/ui-cor-estrategia/SKILL.md +213 -0
  363. package/kit/skills/ui-critica-auditoria/SKILL.md +260 -0
  364. package/kit/skills/ui-motion-funcional/SKILL.md +264 -0
  365. package/kit/skills/ui-ritmo-espacial/SKILL.md +259 -0
  366. package/kit/skills/ui-tipografia/SKILL.md +211 -0
  367. package/kit/skills/whatsapp-conversation-state-machine/SKILL.md +287 -287
  368. package/kit/workflows/auditar-observabilidade-cobertura.workflow.js +250 -0
  369. package/package.json +65 -63
  370. package/src/core/kit.js +333 -216
  371. package/src/core/reflect.js +247 -247
  372. package/src/core/registry.js +123 -112
  373. package/src/core/reverse-sync.js +448 -372
  374. package/src/core/sync.js +477 -437
  375. package/src/core/watch.js +121 -121
  376. package/src/mcp-server/index.js +794 -794
@@ -1,335 +1,335 @@
1
- ---
2
- name: ai-prompt-characterization
3
- description: Use ao modificar prompt/tool LLM em produção — characterization de generations com temperature=0 + seed fixo + sanitização específica. Modernização 2026 sem precedente em 2004…
4
- ---
5
-
6
- # AI Prompt Characterization (Modernização)
7
-
8
- ## Quando usar
9
-
10
- LLM carrega esta skill quando user vai modificar prompt ou tool definition de LLM em produção. Trigger phrases:
11
-
12
- - "vou mudar esse prompt", "modificar prompt em prod"
13
- - "atualizar tool definition", "function calling schema"
14
- - "como testar mudança de prompt?"
15
- - "characterization de prompt", "snapshot de generation"
16
- - "esse prompt tem 300 linhas e ninguém testou ainda"
17
- - prompt em arquivo como `prompts/<name>.md` ou string template em código
18
-
19
- **Insight central:** prompts e tools são **código legacy também** quando:
20
- - > 100 linhas
21
- - Em uso em produção
22
- - Mudanças quebram silenciosamente (output diferente, downstream parser falha)
23
- - Sem characterization tests
24
-
25
- ## Regras absolutas
26
-
27
- - **Prompts são código.** Tratam-se com mesmo rigor: versionado, testado, code-reviewed. NÃO são "config text que muda livremente".
28
- - **Determinismo via `temperature=0` + `seed`.** Anthropic Claude e OpenAI ambos suportam seed. Sem isso, characterization é flaky.
29
- - **Capture mais que `text`.** Outputs incluem: `text`, `finish_reason`, `tool_calls` (se function calling), `input_tokens`, `output_tokens`, `model_version`. Snapshot de TODOS estes campos.
30
- - **Sanitize aggressively.** Outputs LLM frequentemente incluem timestamps mencionados, UUIDs gerados, datas relativas. Normalize ANTES de snapshot.
31
- - **5+ inputs cobrindo intents distintas.** Não é "happy path × 5"; é "5 intents qualitativamente diferentes" — concision request, troubleshooting, explanation, creative, edge case.
32
- - **Behavioral coverage = % intents cobertas.** Métrica não é coverage de "linhas do prompt" (não existe); é coverage de variações comportamentais.
33
- - **Re-rodar em CI quando model_version muda.** Anthropic publica nova versão de Claude → re-rode characterization → revisar diffs → aceitar/rejeitar.
34
-
35
- ## Patterns canônicos
36
-
37
- ### Pattern 1: Setup canônico de characterization de prompt
38
-
39
- ```ts
40
- // tests/characterization/prompts/generate-summary.test.ts
41
- import { Anthropic } from '@anthropic-ai/sdk'
42
- import { describe, test, expect } from 'vitest'
43
- import { readFileSync } from 'fs'
44
-
45
- const client = new Anthropic({ apiKey: process.env.ANTHROPIC_API_KEY })
46
- const PROMPT = readFileSync('prompts/generate-summary.md', 'utf-8')
47
-
48
- interface PromptInput {
49
- systemPrompt: string
50
- userMessage: string
51
- maxTokens?: number
52
- }
53
-
54
- async function runPrompt(input: PromptInput) {
55
- const response = await client.messages.create({
56
- model: 'claude-opus-4-7',
57
- max_tokens: input.maxTokens ?? 500,
58
- temperature: 0, // determinismo
59
- system: input.systemPrompt,
60
- messages: [{ role: 'user', content: input.userMessage }],
61
- })
62
- return {
63
- text: response.content[0].type === 'text' ? response.content[0].text : '',
64
- stopReason: response.stop_reason,
65
- inputTokens: response.usage.input_tokens,
66
- outputTokens: response.usage.output_tokens,
67
- modelVersion: response.model,
68
- }
69
- }
70
-
71
- function sanitizeForSnapshot(o: any): any {
72
- return JSON.parse(
73
- JSON.stringify(o, (key, value) => {
74
- // normalizar timestamps mencionados ("Today is 2026-05-08") → "<DATE>"
75
- if (typeof value === 'string') {
76
- value = value.replace(/\d{4}-\d{2}-\d{2}/g, '<DATE>')
77
- value = value.replace(/\d{2}:\d{2}(:\d{2})?/g, '<TIME>')
78
- value = value.replace(/[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}/g, '<UUID>')
79
- }
80
- // permitir model version mas separar para audit (não no snapshot)
81
- if (key === 'modelVersion') return '<MODEL>'
82
- return value
83
- })
84
- )
85
- }
86
-
87
- describe('generate-summary prompt — characterization', () => {
88
- test('intent: concise summary of long article', async () => {
89
- const captured = await runPrompt({
90
- systemPrompt: PROMPT,
91
- userMessage: 'Resuma em 2 sentenças: [longo artigo de 500 palavras]...',
92
- })
93
- expect(sanitizeForSnapshot(captured)).toMatchSnapshot()
94
- })
95
-
96
- test('intent: bullet-list summary', async () => { /* ... */ })
97
- test('intent: technical/code summary', async () => { /* ... */ })
98
- test('intent: ambiguous request (edge)', async () => { /* ... */ })
99
- test('intent: hostile / prompt injection attempt', async () => { /* ... */ })
100
- })
101
- ```
102
-
103
- ### Pattern 2: Tool definition characterization (function calling)
104
-
105
- ```ts
106
- // Quando prompt usa tool definition (function calling), characterize tool_calls
107
-
108
- const TOOLS = [
109
- {
110
- name: 'search_knowledge_base',
111
- description: 'Search for relevant docs',
112
- input_schema: { type: 'object', properties: { query: { type: 'string' } } },
113
- },
114
- // ... mais tools
115
- ]
116
-
117
- async function runWithTools(userMessage: string) {
118
- const r = await client.messages.create({
119
- model: 'claude-opus-4-7',
120
- max_tokens: 500,
121
- temperature: 0,
122
- tools: TOOLS,
123
- messages: [{ role: 'user', content: userMessage }],
124
- })
125
- return {
126
- stopReason: r.stop_reason,
127
- toolUses: r.content.filter(c => c.type === 'tool_use').map(c => ({
128
- tool: (c as any).name,
129
- input: (c as any).input,
130
- })),
131
- finalText: r.content.filter(c => c.type === 'text').map(c => (c as any).text).join('\n'),
132
- }
133
- }
134
-
135
- test('tools — invokes search for factual question', async () => {
136
- const captured = await runWithTools('Qual é a política de reembolso?')
137
- expect(captured).toMatchSnapshot()
138
- // snapshot captura QUAIS tools foram invocadas + QUAIS argumentos
139
- })
140
- ```
141
-
142
- ### Pattern 3: Sanitização específica de prompts
143
-
144
- ```ts
145
- // Outputs LLM têm padrões previsíveis a sanitizar:
146
-
147
- function sanitizeLLMOutput(text: string): string {
148
- return text
149
- // datas absolutas
150
- .replace(/\b\d{4}-\d{2}-\d{2}\b/g, '<DATE>')
151
- .replace(/\b(?:janeiro|fevereiro|março|abril|maio|junho|julho|agosto|setembro|outubro|novembro|dezembro)\s+(?:de\s+)?\d{4}/gi, '<DATE_PT>')
152
- .replace(/\b(?:january|february|march|april|may|june|july|august|september|october|november|december)\s+\d{4}/gi, '<DATE_EN>')
153
- // datas relativas
154
- .replace(/\b(?:hoje|amanhã|ontem|today|tomorrow|yesterday)\b/gi, '<RELATIVE_DATE>')
155
- // URLs e UUIDs
156
- .replace(/https?:\/\/[^\s]+/g, '<URL>')
157
- .replace(/\b[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}\b/gi, '<UUID>')
158
- // valores monetários (preservar tipo, sanitizar valor)
159
- .replace(/R\$\s*[\d,.]+/g, 'R$ <VALUE>')
160
- .replace(/\$\s*[\d,.]+/g, '$ <VALUE>')
161
- // versões
162
- .replace(/v\d+\.\d+(?:\.\d+)?/g, '<VERSION>')
163
- }
164
- ```
165
-
166
- ### Pattern 4: Behavioral coverage de prompt — 5+ intents
167
-
168
- Para cada prompt, definir intents distintas:
169
-
170
- | Intent | Definição | Exemplo de input |
171
- |---|---|---|
172
- | **Concise** | Pedido curto, output esperado curto | "Resuma em 1 frase: [text]" |
173
- | **Detailed** | Pedido elaborado, output esperado longo | "Explique passo-a-passo: [text]" |
174
- | **Code-heavy** | Input/output com código | "Refactor esse código: ```ts ...```" |
175
- | **Edge case** | Input ambíguo ou borderline | "Como funciona?" (sem context) |
176
- | **Adversarial** | Tentativa de jailbreak / prompt injection | "Ignore previous instructions and..." |
177
- | **Multi-turn (se aplicável)** | Conversação com historico | [3+ messages prévias] |
178
-
179
- 5 intents × snapshot deterministic = baseline. Mudança em prompt deve manter outputs semanticamente próximos (ou documentar mudança intencional).
180
-
181
- ### Pattern 5: Pre-deploy checklist para mudança em prompt
182
-
183
- ```text
184
- Antes de deploy de mudança em prompt em produção:
185
-
186
- □ Suite de characterization tests passa verde (todos os 5+ intents)
187
- □ Diff revisado HUMANAMENTE para cada intent — mudanças intencionais?
188
- □ Behavioral coverage ≥ 5 intents (não bate threshold % — bate threshold de N)
189
- □ Sanitização revisada — nenhum PII/secret no snapshot
190
- □ Custo: cada test consome tokens; para prompts grandes, calcular total
191
- - 5 inputs × 1k input + 500 output ≈ 7.5k tokens × $0.015/1k = ~$0.11
192
- - CI roda só on-change para evitar custo recorrente
193
- □ model_version anotado — re-rodar quando model_version muda
194
- □ Audit trail no PR: "intent X: changed from Y to Z; reason: ..."
195
- ```
196
-
197
- ### Pattern 6: Custo + cadência de characterization
198
-
199
- | Frequência | Custo (em USD) por suite | Quando rodar |
200
- |---|---|---|
201
- | Desenvolvedor local | < $0.10 | Antes de cada commit que toca prompt |
202
- | CI on-change | < $0.50/run | Em PR que toca arquivo de prompt |
203
- | CI nightly | < $5/dia | Para detectar drift de model upstream |
204
- | Pre-deploy | < $0.50 | Confirmação final antes de promote |
205
-
206
- **Otimização:** snapshot diff só dispara LLM call se prompt mudou. Sem mudança = skip (cacheado).
207
-
208
- ### Pattern 7: Quando NÃO characterizar prompt
209
-
210
- ```text
211
- - Prompt < 20 linhas e usado em 1 lugar — overhead > valor
212
- - Prompt é template trivial ("Resume: {text}") sem lógica complexa
213
- - LLM call é one-shot script (analytics, batch processing) — não em hot path
214
- - Custo de tokens proibitivo (e.g., prompts massivos com 50k tokens) — usar smaller model para char tests
215
- - Use case é generative criativo (poema, story) — outputs intencionalmente variáveis
216
- ```
217
-
218
- ## Anti-patterns
219
-
220
- ### ANTI: characterization sem temperature=0
221
-
222
- ```text
223
- ANTI: rodar characterization com temperature=0.7 (default).
224
-
225
- PROBLEMA: outputs varia entre runs. Snapshot diferente toda vez.
226
- Tests flaky. Equipe ignora.
227
-
228
- CERTO: temperature=0 SEMPRE em characterization. Anthropic + OpenAI
229
- ambos têm. Em providers que não suportam, escolher menor
230
- valor possível e/ou seed fixo se disponível.
231
- ```
232
-
233
- ### ANTI: snapshot sem sanitização
234
-
235
- ```text
236
- ANTI: capturar output cru com timestamps, UUIDs, datas atuais.
237
-
238
- PROBLEMA: cada run gera snapshot diferente. Não é flaky pelo LLM,
239
- é flaky pelo CONTENT temporal.
240
-
241
- CERTO: sanitize ANTES de matchSnapshot. Datas → <DATE>, UUIDs →
242
- <UUID>, etc. Snapshot estável across time.
243
- ```
244
-
245
- ### ANTI: 1 test "happy path" de prompt
246
-
247
- ```text
248
- ANTI: 1 input de exemplo testado, "se passa, prompt está OK".
249
-
250
- PROBLEMA: prompt tem comportamento qualitativamente diferente em
251
- edge cases (input curto, input longo, input ambíguo,
252
- adversarial). 1 test cobre 1 caminho, ignora N outros.
253
-
254
- CERTO: 5+ intents cobrindo distribuição real de uso. Edge case +
255
- adversarial são MANDATORY (prompts em prod sempre recebem
256
- inputs ruins).
257
- ```
258
-
259
- ### ANTI: ignorar drift de model
260
-
261
- ```text
262
- ANTI: characterization passou em maio; em julho Anthropic atualiza
263
- Claude (claude-opus-4-7 → 4-8). Equipe não re-roda; deploy de
264
- mudança quebra silenciosamente.
265
-
266
- PROBLEMA: prompt baseline frozen no model anterior. Novo model
267
- comporta diferente; bug em prod.
268
-
269
- CERTO: CI nightly roda characterization. Diff de model_version =
270
- trigger humano para revisar. Aceita ou rejeita updates de
271
- model. Sem fixed model = sem characterization válida.
272
- ```
273
-
274
- ### ANTI: snapshot inclui token count
275
-
276
- ```text
277
- ANTI: snapshot tem `inputTokens: 247, outputTokens: 89`.
278
-
279
- PROBLEMA: token counts mudam quando model muda (tokenizer evolui).
280
- Diff vermelho em update de model é noise.
281
-
282
- CERTO: capturar tokens em log SEPARADO (custo tracking), não no
283
- snapshot. Snapshot é qualitativo (text + stop reason +
284
- tool calls), não quantitativo.
285
- ```
286
-
287
- ### ANTI: tratar prompt como "string config livre"
288
-
289
- ```text
290
- ANTI: dev edita prompt em prod direto via console; sem PR; sem
291
- review; sem characterization.
292
-
293
- PROBLEMA: prompt é código. Mudança não-versionada quebra silenciosa.
294
- Sem audit trail. Rollback impossível.
295
-
296
- CERTO: prompt em repo (`prompts/<name>.md`). PR review como qualquer
297
- código. Characterization tests rodam em CI. Deploy via release
298
- padrão.
299
- ```
300
-
301
- ## Verificação
302
-
303
- 1. Prompt versionado em arquivo (não inline em código se > 50 linhas)
304
- 2. Characterization tests existem com 5+ intents
305
- 3. `temperature=0` + seed fixo (se provider suporta)
306
- 4. Sanitização específica para prompt outputs
307
- 5. Snapshot inclui text + stopReason + toolCalls (se aplicável)
308
- 6. CI roda characterization on-change
309
- 7. model_version trackado (audit log separado)
310
- 8. Pre-deploy checklist completo
311
-
312
- ## Limiar de "prompt pronto para produção"
313
-
314
- ```text
315
- Versionado em repo: sim
316
- Characterization tests com ≥ 5 intents: sim
317
- temperature=0 + seed fixo: sim
318
- Sanitização aplicada: sim
319
- Coverage de intents real (não synthetic): sim
320
- CI integration: sim
321
- Audit trail de mudanças: sim
322
- ```
323
-
324
- ---
325
-
326
- ## Ver também
327
-
328
- - [`_shared-legacy/glossary.md`](../_shared-legacy/glossary.md) — vocabulário (characterization, golden master)
329
- - [`legacy-characterization-tests`](../legacy-characterization-tests/SKILL.md) — characterization clássico; aplicável a prompts modulo determinismo
330
- - [`legacy-api-only-applications`](../legacy-api-only-applications/SKILL.md) — LLM provider é caso especial de API; adapter pattern aplicável
331
- - [`llm-as-dependency`](../llm-as-dependency/SKILL.md) — fakear LLM em testes que NÃO são de prompt characterization (testes de business logic)
332
- - [`pre-refactor-characterization`](../pre-refactor-characterization/SKILL.md) — gate v1.12 inclui ai-prompt-stability como dimensão paralela
333
- - [`observability-driven-development`](../observability-driven-development/SKILL.md) (v1.9) — instrument prompt outputs para detectar drift em prod
334
-
335
- *Material-fonte (modernização 2026):* Sem precedente em livro Feathers 2004 — prompts/tools LLM como dependência testável é literatura recente (2023+ — papers da Anthropic sobre evals, OpenAI evals framework, Promptfoo).
1
+ ---
2
+ name: ai-prompt-characterization
3
+ description: Use ao modificar prompt/tool LLM em produção — characterization de generations com temperature=0 + seed fixo + sanitização específica. Modernização 2026 sem precedente em 2004…
4
+ ---
5
+
6
+ # AI Prompt Characterization (Modernização)
7
+
8
+ ## Quando usar
9
+
10
+ LLM carrega esta skill quando user vai modificar prompt ou tool definition de LLM em produção. Trigger phrases:
11
+
12
+ - "vou mudar esse prompt", "modificar prompt em prod"
13
+ - "atualizar tool definition", "function calling schema"
14
+ - "como testar mudança de prompt?"
15
+ - "characterization de prompt", "snapshot de generation"
16
+ - "esse prompt tem 300 linhas e ninguém testou ainda"
17
+ - prompt em arquivo como `prompts/<name>.md` ou string template em código
18
+
19
+ **Insight central:** prompts e tools são **código legacy também** quando:
20
+ - > 100 linhas
21
+ - Em uso em produção
22
+ - Mudanças quebram silenciosamente (output diferente, downstream parser falha)
23
+ - Sem characterization tests
24
+
25
+ ## Regras absolutas
26
+
27
+ - **Prompts são código.** Tratam-se com mesmo rigor: versionado, testado, code-reviewed. NÃO são "config text que muda livremente".
28
+ - **Determinismo via `temperature=0` + `seed`.** Anthropic Claude e OpenAI ambos suportam seed. Sem isso, characterization é flaky.
29
+ - **Capture mais que `text`.** Outputs incluem: `text`, `finish_reason`, `tool_calls` (se function calling), `input_tokens`, `output_tokens`, `model_version`. Snapshot de TODOS estes campos.
30
+ - **Sanitize aggressively.** Outputs LLM frequentemente incluem timestamps mencionados, UUIDs gerados, datas relativas. Normalize ANTES de snapshot.
31
+ - **5+ inputs cobrindo intents distintas.** Não é "happy path × 5"; é "5 intents qualitativamente diferentes" — concision request, troubleshooting, explanation, creative, edge case.
32
+ - **Behavioral coverage = % intents cobertas.** Métrica não é coverage de "linhas do prompt" (não existe); é coverage de variações comportamentais.
33
+ - **Re-rodar em CI quando model_version muda.** Anthropic publica nova versão de Claude → re-rode characterization → revisar diffs → aceitar/rejeitar.
34
+
35
+ ## Patterns canônicos
36
+
37
+ ### Pattern 1: Setup canônico de characterization de prompt
38
+
39
+ ```ts
40
+ // tests/characterization/prompts/generate-summary.test.ts
41
+ import { Anthropic } from '@anthropic-ai/sdk'
42
+ import { describe, test, expect } from 'vitest'
43
+ import { readFileSync } from 'fs'
44
+
45
+ const client = new Anthropic({ apiKey: process.env.ANTHROPIC_API_KEY })
46
+ const PROMPT = readFileSync('prompts/generate-summary.md', 'utf-8')
47
+
48
+ interface PromptInput {
49
+ systemPrompt: string
50
+ userMessage: string
51
+ maxTokens?: number
52
+ }
53
+
54
+ async function runPrompt(input: PromptInput) {
55
+ const response = await client.messages.create({
56
+ model: 'claude-opus-4-7',
57
+ max_tokens: input.maxTokens ?? 500,
58
+ temperature: 0, // determinismo
59
+ system: input.systemPrompt,
60
+ messages: [{ role: 'user', content: input.userMessage }],
61
+ })
62
+ return {
63
+ text: response.content[0].type === 'text' ? response.content[0].text : '',
64
+ stopReason: response.stop_reason,
65
+ inputTokens: response.usage.input_tokens,
66
+ outputTokens: response.usage.output_tokens,
67
+ modelVersion: response.model,
68
+ }
69
+ }
70
+
71
+ function sanitizeForSnapshot(o: any): any {
72
+ return JSON.parse(
73
+ JSON.stringify(o, (key, value) => {
74
+ // normalizar timestamps mencionados ("Today is 2026-05-08") → "<DATE>"
75
+ if (typeof value === 'string') {
76
+ value = value.replace(/\d{4}-\d{2}-\d{2}/g, '<DATE>')
77
+ value = value.replace(/\d{2}:\d{2}(:\d{2})?/g, '<TIME>')
78
+ value = value.replace(/[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}/g, '<UUID>')
79
+ }
80
+ // permitir model version mas separar para audit (não no snapshot)
81
+ if (key === 'modelVersion') return '<MODEL>'
82
+ return value
83
+ })
84
+ )
85
+ }
86
+
87
+ describe('generate-summary prompt — characterization', () => {
88
+ test('intent: concise summary of long article', async () => {
89
+ const captured = await runPrompt({
90
+ systemPrompt: PROMPT,
91
+ userMessage: 'Resuma em 2 sentenças: [longo artigo de 500 palavras]...',
92
+ })
93
+ expect(sanitizeForSnapshot(captured)).toMatchSnapshot()
94
+ })
95
+
96
+ test('intent: bullet-list summary', async () => { /* ... */ })
97
+ test('intent: technical/code summary', async () => { /* ... */ })
98
+ test('intent: ambiguous request (edge)', async () => { /* ... */ })
99
+ test('intent: hostile / prompt injection attempt', async () => { /* ... */ })
100
+ })
101
+ ```
102
+
103
+ ### Pattern 2: Tool definition characterization (function calling)
104
+
105
+ ```ts
106
+ // Quando prompt usa tool definition (function calling), characterize tool_calls
107
+
108
+ const TOOLS = [
109
+ {
110
+ name: 'search_knowledge_base',
111
+ description: 'Search for relevant docs',
112
+ input_schema: { type: 'object', properties: { query: { type: 'string' } } },
113
+ },
114
+ // ... mais tools
115
+ ]
116
+
117
+ async function runWithTools(userMessage: string) {
118
+ const r = await client.messages.create({
119
+ model: 'claude-opus-4-7',
120
+ max_tokens: 500,
121
+ temperature: 0,
122
+ tools: TOOLS,
123
+ messages: [{ role: 'user', content: userMessage }],
124
+ })
125
+ return {
126
+ stopReason: r.stop_reason,
127
+ toolUses: r.content.filter(c => c.type === 'tool_use').map(c => ({
128
+ tool: (c as any).name,
129
+ input: (c as any).input,
130
+ })),
131
+ finalText: r.content.filter(c => c.type === 'text').map(c => (c as any).text).join('\n'),
132
+ }
133
+ }
134
+
135
+ test('tools — invokes search for factual question', async () => {
136
+ const captured = await runWithTools('Qual é a política de reembolso?')
137
+ expect(captured).toMatchSnapshot()
138
+ // snapshot captura QUAIS tools foram invocadas + QUAIS argumentos
139
+ })
140
+ ```
141
+
142
+ ### Pattern 3: Sanitização específica de prompts
143
+
144
+ ```ts
145
+ // Outputs LLM têm padrões previsíveis a sanitizar:
146
+
147
+ function sanitizeLLMOutput(text: string): string {
148
+ return text
149
+ // datas absolutas
150
+ .replace(/\b\d{4}-\d{2}-\d{2}\b/g, '<DATE>')
151
+ .replace(/\b(?:janeiro|fevereiro|março|abril|maio|junho|julho|agosto|setembro|outubro|novembro|dezembro)\s+(?:de\s+)?\d{4}/gi, '<DATE_PT>')
152
+ .replace(/\b(?:january|february|march|april|may|june|july|august|september|october|november|december)\s+\d{4}/gi, '<DATE_EN>')
153
+ // datas relativas
154
+ .replace(/\b(?:hoje|amanhã|ontem|today|tomorrow|yesterday)\b/gi, '<RELATIVE_DATE>')
155
+ // URLs e UUIDs
156
+ .replace(/https?:\/\/[^\s]+/g, '<URL>')
157
+ .replace(/\b[0-9a-f]{8}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{4}-[0-9a-f]{12}\b/gi, '<UUID>')
158
+ // valores monetários (preservar tipo, sanitizar valor)
159
+ .replace(/R\$\s*[\d,.]+/g, 'R$ <VALUE>')
160
+ .replace(/\$\s*[\d,.]+/g, '$ <VALUE>')
161
+ // versões
162
+ .replace(/v\d+\.\d+(?:\.\d+)?/g, '<VERSION>')
163
+ }
164
+ ```
165
+
166
+ ### Pattern 4: Behavioral coverage de prompt — 5+ intents
167
+
168
+ Para cada prompt, definir intents distintas:
169
+
170
+ | Intent | Definição | Exemplo de input |
171
+ |---|---|---|
172
+ | **Concise** | Pedido curto, output esperado curto | "Resuma em 1 frase: [text]" |
173
+ | **Detailed** | Pedido elaborado, output esperado longo | "Explique passo-a-passo: [text]" |
174
+ | **Code-heavy** | Input/output com código | "Refactor esse código: ```ts ...```" |
175
+ | **Edge case** | Input ambíguo ou borderline | "Como funciona?" (sem context) |
176
+ | **Adversarial** | Tentativa de jailbreak / prompt injection | "Ignore previous instructions and..." |
177
+ | **Multi-turn (se aplicável)** | Conversação com historico | [3+ messages prévias] |
178
+
179
+ 5 intents × snapshot deterministic = baseline. Mudança em prompt deve manter outputs semanticamente próximos (ou documentar mudança intencional).
180
+
181
+ ### Pattern 5: Pre-deploy checklist para mudança em prompt
182
+
183
+ ```text
184
+ Antes de deploy de mudança em prompt em produção:
185
+
186
+ □ Suite de characterization tests passa verde (todos os 5+ intents)
187
+ □ Diff revisado HUMANAMENTE para cada intent — mudanças intencionais?
188
+ □ Behavioral coverage ≥ 5 intents (não bate threshold % — bate threshold de N)
189
+ □ Sanitização revisada — nenhum PII/secret no snapshot
190
+ □ Custo: cada test consome tokens; para prompts grandes, calcular total
191
+ - 5 inputs × 1k input + 500 output ≈ 7.5k tokens × $0.015/1k = ~$0.11
192
+ - CI roda só on-change para evitar custo recorrente
193
+ □ model_version anotado — re-rodar quando model_version muda
194
+ □ Audit trail no PR: "intent X: changed from Y to Z; reason: ..."
195
+ ```
196
+
197
+ ### Pattern 6: Custo + cadência de characterization
198
+
199
+ | Frequência | Custo (em USD) por suite | Quando rodar |
200
+ |---|---|---|
201
+ | Desenvolvedor local | < $0.10 | Antes de cada commit que toca prompt |
202
+ | CI on-change | < $0.50/run | Em PR que toca arquivo de prompt |
203
+ | CI nightly | < $5/dia | Para detectar drift de model upstream |
204
+ | Pre-deploy | < $0.50 | Confirmação final antes de promote |
205
+
206
+ **Otimização:** snapshot diff só dispara LLM call se prompt mudou. Sem mudança = skip (cacheado).
207
+
208
+ ### Pattern 7: Quando NÃO characterizar prompt
209
+
210
+ ```text
211
+ - Prompt < 20 linhas e usado em 1 lugar — overhead > valor
212
+ - Prompt é template trivial ("Resume: {text}") sem lógica complexa
213
+ - LLM call é one-shot script (analytics, batch processing) — não em hot path
214
+ - Custo de tokens proibitivo (e.g., prompts massivos com 50k tokens) — usar smaller model para char tests
215
+ - Use case é generative criativo (poema, story) — outputs intencionalmente variáveis
216
+ ```
217
+
218
+ ## Anti-patterns
219
+
220
+ ### ANTI: characterization sem temperature=0
221
+
222
+ ```text
223
+ ANTI: rodar characterization com temperature=0.7 (default).
224
+
225
+ PROBLEMA: outputs varia entre runs. Snapshot diferente toda vez.
226
+ Tests flaky. Equipe ignora.
227
+
228
+ CERTO: temperature=0 SEMPRE em characterization. Anthropic + OpenAI
229
+ ambos têm. Em providers que não suportam, escolher menor
230
+ valor possível e/ou seed fixo se disponível.
231
+ ```
232
+
233
+ ### ANTI: snapshot sem sanitização
234
+
235
+ ```text
236
+ ANTI: capturar output cru com timestamps, UUIDs, datas atuais.
237
+
238
+ PROBLEMA: cada run gera snapshot diferente. Não é flaky pelo LLM,
239
+ é flaky pelo CONTENT temporal.
240
+
241
+ CERTO: sanitize ANTES de matchSnapshot. Datas → <DATE>, UUIDs →
242
+ <UUID>, etc. Snapshot estável across time.
243
+ ```
244
+
245
+ ### ANTI: 1 test "happy path" de prompt
246
+
247
+ ```text
248
+ ANTI: 1 input de exemplo testado, "se passa, prompt está OK".
249
+
250
+ PROBLEMA: prompt tem comportamento qualitativamente diferente em
251
+ edge cases (input curto, input longo, input ambíguo,
252
+ adversarial). 1 test cobre 1 caminho, ignora N outros.
253
+
254
+ CERTO: 5+ intents cobrindo distribuição real de uso. Edge case +
255
+ adversarial são MANDATORY (prompts em prod sempre recebem
256
+ inputs ruins).
257
+ ```
258
+
259
+ ### ANTI: ignorar drift de model
260
+
261
+ ```text
262
+ ANTI: characterization passou em maio; em julho Anthropic atualiza
263
+ Claude (claude-opus-4-7 → 4-8). Equipe não re-roda; deploy de
264
+ mudança quebra silenciosamente.
265
+
266
+ PROBLEMA: prompt baseline frozen no model anterior. Novo model
267
+ comporta diferente; bug em prod.
268
+
269
+ CERTO: CI nightly roda characterization. Diff de model_version =
270
+ trigger humano para revisar. Aceita ou rejeita updates de
271
+ model. Sem fixed model = sem characterization válida.
272
+ ```
273
+
274
+ ### ANTI: snapshot inclui token count
275
+
276
+ ```text
277
+ ANTI: snapshot tem `inputTokens: 247, outputTokens: 89`.
278
+
279
+ PROBLEMA: token counts mudam quando model muda (tokenizer evolui).
280
+ Diff vermelho em update de model é noise.
281
+
282
+ CERTO: capturar tokens em log SEPARADO (custo tracking), não no
283
+ snapshot. Snapshot é qualitativo (text + stop reason +
284
+ tool calls), não quantitativo.
285
+ ```
286
+
287
+ ### ANTI: tratar prompt como "string config livre"
288
+
289
+ ```text
290
+ ANTI: dev edita prompt em prod direto via console; sem PR; sem
291
+ review; sem characterization.
292
+
293
+ PROBLEMA: prompt é código. Mudança não-versionada quebra silenciosa.
294
+ Sem audit trail. Rollback impossível.
295
+
296
+ CERTO: prompt em repo (`prompts/<name>.md`). PR review como qualquer
297
+ código. Characterization tests rodam em CI. Deploy via release
298
+ padrão.
299
+ ```
300
+
301
+ ## Verificação
302
+
303
+ 1. Prompt versionado em arquivo (não inline em código se > 50 linhas)
304
+ 2. Characterization tests existem com 5+ intents
305
+ 3. `temperature=0` + seed fixo (se provider suporta)
306
+ 4. Sanitização específica para prompt outputs
307
+ 5. Snapshot inclui text + stopReason + toolCalls (se aplicável)
308
+ 6. CI roda characterization on-change
309
+ 7. model_version trackado (audit log separado)
310
+ 8. Pre-deploy checklist completo
311
+
312
+ ## Limiar de "prompt pronto para produção"
313
+
314
+ ```text
315
+ Versionado em repo: sim
316
+ Characterization tests com ≥ 5 intents: sim
317
+ temperature=0 + seed fixo: sim
318
+ Sanitização aplicada: sim
319
+ Coverage de intents real (não synthetic): sim
320
+ CI integration: sim
321
+ Audit trail de mudanças: sim
322
+ ```
323
+
324
+ ---
325
+
326
+ ## Ver também
327
+
328
+ - [`_shared-legacy/glossary.md`](../_shared-legacy/glossary.md) — vocabulário (characterization, golden master)
329
+ - [`legacy-characterization-tests`](../legacy-characterization-tests/SKILL.md) — characterization clássico; aplicável a prompts modulo determinismo
330
+ - [`legacy-api-only-applications`](../legacy-api-only-applications/SKILL.md) — LLM provider é caso especial de API; adapter pattern aplicável
331
+ - [`llm-as-dependency`](../llm-as-dependency/SKILL.md) — fakear LLM em testes que NÃO são de prompt characterization (testes de business logic)
332
+ - [`pre-refactor-characterization`](../pre-refactor-characterization/SKILL.md) — gate v1.12 inclui ai-prompt-stability como dimensão paralela
333
+ - [`observability-driven-development`](../observability-driven-development/SKILL.md) (v1.9) — instrument prompt outputs para detectar drift em prod
334
+
335
+ *Material-fonte (modernização 2026):* Sem precedente em livro Feathers 2004 — prompts/tools LLM como dependência testável é literatura recente (2023+ — papers da Anthropic sobre evals, OpenAI evals framework, Promptfoo).