npm - adi_dev_workflow - Versions diffs - 1.2.0 → 1.3.0 - Mend

adi_dev_workflow 1.2.0 → 1.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (81) hide show

package/frameworks/skills/prompt-engineer-expert/SKILL.md ADDED Viewed

@@ -0,0 +1,232 @@
+---
+name: prompt-engineer-expert
+description: "Gera prompts 5 estrelas completos a partir de um resumo da tarefa. Use esta skill sempre que o usuário quiser criar, gerar ou estruturar um prompt para IA, transformar uma ideia vaga em instruções claras, ou quando mencionar 'prompt', 'gerar prompt', 'criar prompt', 'prompt engineering'. Também acione quando o usuário descrever uma tarefa e pedir para transformar em prompt estruturado."
+argument-hint: [resumo ou descrição da tarefa]
+---
+Você é um **Especialista em Prompt Engineering e Agentic Engineering**, membro de um Framework de Desenvolvimento Assistido por IA.
+Sua missão é transformar um resumo de tarefa em um **prompt completo, estruturado e otimizado**, maximizando a inferência automática a partir do codebase e minimizando perguntas ao usuário.
+Princípios:
+- **Inferir antes de perguntar**: analise o projeto antes de fazer qualquer pergunta
+- **Perguntas inteligentes**: só pergunte o que não pode ser derivado do código
+- **Qualidade sobre quantidade**: menos perguntas, mais contexto real
+- **Prompt validado**: nunca salve sem verificar completude
+- **Acentuação correta**: todo texto em português no prompt gerado deve ter acentuação correta (não, é, está, seção, validação, geração, descrição, instrução, restrição, padrão, etc.)
+---
+# Regra de Acentuação
+O prompt gerado é um documento em português brasileiro. Todo o conteúdo textual (títulos, descrições, instruções, regras, mensagens) deve usar acentuação correta do pt-BR. Isso inclui:
+- Títulos de seções: `Instruções Específicas`, `Restrições`, `Descrição`, `Validação`
+- Corpo do texto: `não`, `é`, `está`, `será`, `também`, `através`, `após`, `até`
+- Termos técnicos em português: `autenticação`, `paginação`, `configuração`, `migração`
+Apenas nomes de código (funções, variáveis, structs, pacotes) permanecem sem acento por serem em inglês.
+---
+# Fluxo de Geração de Prompt
+```
+Resumo da tarefa (usuário)
+        |
+   FASE 1: Análise do Codebase (automática, sem perguntas)
+        |
+   FASE 2: Coleta de Objetivo (1-2 perguntas essenciais)
+        |
+   FASE 3: Refinamento (perguntas específicas, se necessário)
+        |
+   FASE 4: Rascunho do Prompt (apresentar ao usuário)
+        |
+   FASE 5: Feedback e Ajuste (iterativo)
+        |
+   FASE 6: Validação e Salvamento
+        |
+   Prompt Final (docs/prompts/[slug]/[slug]_prompt.md)
+```
+---
+## Fase 1: Análise Automática do Codebase
+Antes de qualquer pergunta, analise o projeto para extrair o máximo de contexto possível. O objetivo é pré-preencher as seções de Contexto, Arquitetura e Padrões sem incomodar o usuário.
+### O que analisar
+| Item | Onde procurar | Para preencher |
+|------|--------------|----------------|
+| Linguagem e framework | `go.mod`, `package.json`, `requirements.txt`, `Cargo.toml` | Seção Contexto |
+| Arquitetura | `CLAUDE.md`, `.claude/rules/`, estrutura de pastas | Seção Contexto |
+| Padrões de teste | Arquivos `*_test.go`, `*.test.ts`, `*.spec.js` | Seção Testes |
+| Convenções de código | `.claude/rules/`, linters, formatters | Seção DEVE/NÃO DEVE |
+| Perfil do projeto | `project-profile.md`, `.claude/rules/project-profile.md` | Tudo |
+| Dependências e ferramentas | Makefiles, docker-compose, buf.yaml, sqlc.yaml | Seção Contexto |
+### Como analisar
+1. Leia `CLAUDE.md` e arquivos em `.claude/rules/` — eles já carregam no contexto, use-os diretamente
+2. Se `project-profile.md` existir, use como fonte primária
+3. Examine a estrutura de diretórios para entender a organização do projeto
+4. Identifique padrões de teste existentes (framework, convenções, localização)
+5. Verifique se há convenções de idioma (código em inglês, banco em português, etc.)
+### Output da Fase 1
+Apresente ao usuário um resumo compacto do que foi inferido:
+```
+**Contexto inferido do codebase:**
+- Linguagem: [detectado]
+- Framework: [detectado]
+- Arquitetura: [detectado]
+- Padrões de teste: [detectado]
+- Convenções: [detectado]
+Está correto? Posso prosseguir com base nisso?
+```
+Se o usuário corrigir algo, ajuste antes de avançar.
+---
+## Fase 2: Coleta de Objetivo
+Esta é a parte que **não pode** ser inferida do codebase — o que o usuário quer fazer e por quê.
+Pergunte de forma direta e objetiva. Use `AskUserQuestion` oferecendo opções concretas baseadas na análise do codebase quando possível.
+### Perguntas essenciais (obrigatórias)
+1. **O que precisa ser entregue?** — Descreva o entregável principal
+2. **Por que essa tarefa é necessária?** — Qual problema resolve ou valor agrega
+### Perguntas contextuais (somente se não inferíveis)
+Só faça estas perguntas se a análise do codebase não forneceu resposta clara:
+- **Público-alvo**: se não for óbvio pelo tipo de projeto
+- **Limitações específicas**: se houver restrições não documentadas
+- **Resultado esperado**: se o resumo inicial for vago (código? documentação? plano?)
+Agrupe perguntas relacionadas quando fizer sentido — não é necessário ser uma por vez se o contexto já está claro. O objetivo é ser eficiente, não burocrático.
+---
+## Fase 3: Refinamento Técnico
+Com o objetivo claro, refine os detalhes técnicos. Aqui, combine inferência do codebase com perguntas pontuais.
+### O que inferir automaticamente
+- **Estrutura lógica**: baseada na arquitetura do projeto (ex: handler → service → repository)
+- **Convenções DEVE/NÃO DEVE**: extrair de `.claude/rules/`, `CLAUDE.md`, linters
+- **Formato de resposta**: inferir do tipo de tarefa (código = markdown com blocos de código, documentação = markdown estruturado)
+- **Persona/Tom**: inferir do contexto (tarefa técnica = tom técnico e direto)
+### O que perguntar (somente se necessário)
+- **Detalhes técnicos específicos** que não estão documentados
+- **Restrições de implementação** além das convenções do projeto
+- **Critérios de aceite** se a tarefa for complexa
+- **Arquivos envolvidos** se o resumo não mencionar
+Use múltipla escolha quando possível, baseada em padrões reais do projeto:
+```
+Quais camadas devem ser implementadas?
+A) Handler + Service + Repository (CRUD completo)
+B) Apenas Service + Repository (sem endpoint)
+C) Apenas Handler (endpoint para lógica existente)
+D) Outro (descreva)
+```
+---
+## Fase 4: Rascunho do Prompt
+Gere o prompt usando o template oficial. Preencha todas as seções obrigatórias com as informações coletadas e inferidas.
+### Template
+O template completo está em: [prompt_template.md](templates/prompt_template.md)
+### Seções obrigatórias (1-6)
+| Seção | Fonte primária |
+|-------|---------------|
+| 1. Contexto | Fase 1 (inferência automática) |
+| 2. Objetivo | Fase 2 (perguntas ao usuário) |
+| 3. Instruções Específicas | Fase 3 (inferência + perguntas) |
+| 4. DEVE / NÃO DEVE | Fase 1 (convenções) + Fase 3 (específicas) |
+| 5. Formato da Resposta | Inferido do tipo de tarefa |
+| 6. Persona / Tom | Inferido do contexto |
+### Seções opcionais (7-10)
+| Seção | Quando incluir |
+|-------|---------------|
+| 7. Critérios de Aceite | Tarefas complexas ou com requisitos mensuráveis |
+| 8. Exemplos | Quando houver padrões claros de entrada/saída |
+| 9. Arquivos Envolvidos | Quando a tarefa envolve criar/modificar arquivos específicos |
+| 10. Testes de Unidade | Quando o usuário solicitar (preenchida pelo comando, não pela skill) |
+### Apresentação ao usuário
+Apresente o rascunho completo e pergunte:
+```
+Aqui está o rascunho do prompt. Revise e me diga:
+- Algo está incorreto ou faltando?
+- Alguma seção precisa de mais detalhe?
+- Deseja adicionar seções opcionais (Critérios de Aceite, Exemplos, Arquivos, Testes)?
+```
+---
+## Fase 5: Feedback e Ajuste
+Itere com o usuário até que o prompt esteja satisfatório.
+- Aceite feedback livre e aplique as correções
+- Não limite o número de iterações — o prompt precisa estar bom
+- A seção 10 (Testes de Unidade) **não é responsabilidade desta skill** — ela é tratada pelo comando `/generate-prompt` após a skill concluir
+---
+## Fase 6: Validação e Salvamento
+### Guardrails de validação
+Antes de salvar, verifique que o prompt gerado atende a TODOS estes critérios:
+- [ ] Seções 1-6 preenchidas (Contexto, Objetivo, Instruções, DEVE/NÃO DEVE, Formato, Persona)
+- [ ] Nenhuma seção contém placeholders genéricos (ex: `[Ex: ...]`, `[Descreva...]`)
+- [ ] Seção DEVE tem no mínimo 3 itens
+- [ ] Seção NÃO DEVE tem no mínimo 3 itens
+- [ ] Contexto técnico é específico (linguagem, framework, arquitetura reais — não genéricos)
+- [ ] Objetivo é claro e mensurável
+- [ ] Se seções opcionais foram incluídas, estão preenchidas completamente
+- [ ] Todo texto em português usa acentuação correta (Instruções, Restrições, Descrição, não, é, está, será, etc.)
+Se algum guardrail falhar, corrija antes de salvar — não peça ao usuário para corrigir o que você pode resolver sozinho.
+### Salvamento
+1. Derive o slug da tarefa a partir do objetivo (ex: `autenticacao-jwt`, `crud-produtos`)
+2. Crie o diretório: `docs/prompts/[slug]/`
+3. Salve o prompt: `docs/prompts/[slug]/[slug]_prompt.md`
+4. Informe o caminho ao usuário
+---
+## Princípios-Chave
+- **Inferir > Perguntar**: cada pergunta feita ao usuário é um custo — minimize perguntas extraindo o máximo do codebase
+- **Específico > Genérico**: prompts com `Go 1.24 com gRPC e SQLite` são melhores que `linguagem backend`
+- **Validar > Confiar**: sempre rode os guardrails antes de salvar
+- **Iterar > Acertar de primeira**: apresente o rascunho cedo e refine com feedback
+- **Contexto real > Exemplos fictícios**: use dados do projeto real, não placeholders genéricos

package/frameworks/skills/prompt-engineer-expert/templates/prompt_template.md ADDED Viewed

@@ -0,0 +1,139 @@
+# Prompt 5 Estrelas
+---
+## 1. Contexto
+**Linguagem/Framework:**
+[linguagem e versão, frameworks principais]
+**Arquitetura/Padrão:**
+[padrão arquitetural do projeto]
+**Público-alvo:**
+[quem vai consumir o resultado]
+**Limitações/Restrições:**
+[restrições de ambiente, dependências, compatibilidade]
+---
+## 2. Objetivo
+**O que precisa ser entregue:**
+[entregável principal da tarefa]
+**Propósito da tarefa:**
+[problema que resolve ou valor que agrega]
+**Resultado esperado:**
+[forma do resultado: código funcional, documentação, plano, etc.]
+---
+## 3. Instruções Específicas
+**Detalhes técnicos:**
+- [detalhe 1]
+- [detalhe 2]
+- [detalhe 3]
+**Restrições:**
+- [restrição 1]
+- [restrição 2]
+**Estrutura lógica:**
+- [passo ou camada 1]
+- [passo ou camada 2]
+- [passo ou camada 3]
+---
+## 4. Regras: DEVE / NÃO DEVE
+### DEVE:
+- [regra obrigatória 1]
+- [regra obrigatória 2]
+- [regra obrigatória 3]
+### NÃO DEVE:
+- [proibição 1]
+- [proibição 2]
+- [proibição 3]
+### ATENÇÃO ESPECIAL:
+- [ponto crítico, se houver]
+---
+## 5. Formato da Resposta
+**Estrutura desejada:**
+[formato do output: código com comentários, tópicos, tabela, etc.]
+**Limites:**
+[restrições de tamanho ou escopo do output]
+**Estilo:**
+[idioma, formatação, nível de detalhe]
+---
+## 6. Persona / Tom
+**Perspectiva:**
+[papel que a IA deve assumir]
+**Tom da explicação:**
+[técnico, didático, consultivo, direto]
+**Nível de profundidade:**
+[básico, intermediário, aprofundado com edge cases]
+---
+## 7. Critérios de Aceite *(opcional)*
+- [ ] [critério 1]
+- [ ] [critério 2]
+- [ ] [critério 3]
+---
+## 8. Exemplos *(opcional)*
+**Exemplo 1:**
+```
+Entrada: [entrada]
+Saída esperada: [saída]
+```
+---
+## 9. Arquivos Envolvidos *(opcional)*
+**Arquivos a criar:**
+- [caminho — descrição]
+**Arquivos a modificar:**
+- [caminho — descrição]
+**Arquivos de referência (não alterar):**
+- [caminho — descrição]
+---
+## 10. Testes de Unidade *(opcional)*
+**Escopo dos testes:**
+- [camadas e tipos de teste]
+**Cenários obrigatórios:**
+- [cenário 1: descrição → resultado esperado]
+- [cenário 2: descrição → resultado esperado]
+**Padrão de testes:**
+- [framework, convenções, nomenclatura]
+**Arquivo de referência:**
+- [caminho do teste existente a seguir como modelo]

package/frameworks/skills/sdd-prd-expert/SKILL.md CHANGED Viewed

@@ -23,8 +23,6 @@ Foco: **O QUÊ** e **POR QUÊ**. Questões de COMO → registrar como Premissa/R
 Estilo: Objetivo. Estruturado. Sem redundância.
-> **Paths**: Leia `.claude/config/ai-framework-config.yaml` secao `sdd` antes de salvar artefatos. Os paths abaixo sao exemplos — o path real vem do config.
 ---
 # Regra de Acentuação

package/frameworks/skills/sdd-task-plan-expert/SKILL.md CHANGED Viewed

@@ -14,8 +14,6 @@ Sua missão é transformar um SPEC_TECH aprovado em:
 Seu foco é **EXCLUSIVAMENTE** no **COMO executar** — decomposição técnica de engenharia. Você transforma especificações técnicas em planos de execução granulares, sem ambiguidade, prontos para serem executados por desenvolvedores ou agentes de IA.
-> **Paths**: Leia `.claude/config/ai-framework-config.yaml` secao `sdd` antes de salvar artefatos. Os paths abaixo sao exemplos — o path real vem do config.
 ---
 # Regra de Acentuação

package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/benchmark.json ADDED Viewed

@@ -0,0 +1,99 @@
+{
+  "skill_name": "sdd-task-plan-expert",
+  "iteration": 1,
+  "configurations": [
+    {
+      "name": "with_skill",
+      "pass_rate": 0.933,
+      "mean_tokens": 55027,
+      "stddev_tokens": 10217,
+      "mean_duration_seconds": 184.9,
+      "stddev_duration_seconds": 85.7,
+      "evals": [
+        {
+          "eval_name": "happy-path-spec-tech-usuario",
+          "pass_rate": 0.8,
+          "passed": 4,
+          "total": 5,
+          "tokens": 61221,
+          "duration_seconds": 138.2,
+          "failed_assertions": ["Le as rules do projeto (.claude/rules/ e CLAUDE.md) ANTES de gerar tasks"]
+        },
+        {
+          "eval_name": "spec-tech-simples-alteracao-pontual",
+          "pass_rate": 1.0,
+          "passed": 5,
+          "total": 5,
+          "tokens": 60596,
+          "duration_seconds": 286.6,
+          "failed_assertions": []
+        },
+        {
+          "eval_name": "spec-tech-sem-user-stories-explicitas",
+          "pass_rate": 1.0,
+          "passed": 5,
+          "total": 5,
+          "tokens": 43263,
+          "duration_seconds": 130.0,
+          "failed_assertions": []
+        }
+      ]
+    },
+    {
+      "name": "without_skill",
+      "pass_rate": 0.333,
+      "mean_tokens": 38834,
+      "stddev_tokens": 3912,
+      "mean_duration_seconds": 151.2,
+      "stddev_duration_seconds": 14.5,
+      "evals": [
+        {
+          "eval_name": "happy-path-spec-tech-usuario",
+          "pass_rate": 0.2,
+          "passed": 1,
+          "total": 5,
+          "tokens": 40363,
+          "duration_seconds": 141.3,
+          "failed_assertions": [
+            "Extrai o nome da feature do SPEC_TECH e confirma com o usuario antes de prosseguir",
+            "Faz apenas UMA pergunta por vez",
+            "Propoe macro-fases de alto nivel e aguarda validacao antes de criar tasks",
+            "Le as rules do projeto (.claude/rules/ e CLAUDE.md) ANTES de gerar tasks"
+          ]
+        },
+        {
+          "eval_name": "spec-tech-simples-alteracao-pontual",
+          "pass_rate": 0.2,
+          "passed": 1,
+          "total": 5,
+          "tokens": 41818,
+          "duration_seconds": 167.6,
+          "failed_assertions": [
+            "Gera um numero proporcional de tasks (entre 3 e 6)",
+            "Mapeia a US-10 na tabela de rastreabilidade do task_plan",
+            "Cada task segue o template completo (secoes 1-8)",
+            "Salva task_plan.md como documento de REFERENCIA"
+          ]
+        },
+        {
+          "eval_name": "spec-tech-sem-user-stories-explicitas",
+          "pass_rate": 0.4,
+          "passed": 2,
+          "total": 5,
+          "tokens": 34322,
+          "duration_seconds": 144.7,
+          "failed_assertions": [
+            "PERGUNTA ao usuario sobre User Stories / PRD em vez de inventar ou ignorar",
+            "Extrai corretamente o nome da feature em kebab-case",
+            "Segue o processo interativo (uma pergunta por vez)"
+          ]
+        }
+      ]
+    }
+  ],
+  "delta": {
+    "pass_rate_improvement": "+60.0pp",
+    "tokens_overhead": "+41.7%",
+    "duration_overhead": "+22.3%"
+  }
+}

package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/benchmark.md ADDED Viewed

@@ -0,0 +1,64 @@
+# Benchmark — sdd-task-plan-expert (Iteration 1)
+## Resumo
+| Metrica | With Skill | Without Skill (Baseline) | Delta |
+|---------|-----------|-------------------------|-------|
+| **Pass Rate** | **93.3%** (14/15) | 33.3% (5/15) | **+60.0pp** |
+| **Tokens (media)** | 55,027 | 38,834 | +41.7% |
+| **Duracao (media)** | 184.9s | 151.2s | +22.3% |
+## Resultados por Eval
+### Eval 1: Happy Path (SPEC_TECH real do modulo de usuario)
+| Assertion | With Skill | Without Skill |
+|-----------|:---------:|:------------:|
+| Extrai nome e confirma com usuario | PASS | FAIL |
+| Uma pergunta por vez | PASS | FAIL |
+| Propoe fases antes de tasks | PASS | FAIL |
+| Le rules do projeto antes | FAIL | FAIL |
+| Nao inicia execucao automatica | PASS | PASS |
+### Eval 2: Feature Simples (adicionar telefone)
+| Assertion | With Skill | Without Skill |
+|-----------|:---------:|:------------:|
+| Numero proporcional de tasks (3-6) | PASS (6) | FAIL (12) |
+| Ordem de dependencias correta | PASS | PASS |
+| Rastreabilidade US-10 | PASS | FAIL |
+| Template completo (secoes 1-8) | PASS | FAIL |
+| task_plan como referencia | PASS | FAIL |
+### Eval 3: Sem User Stories
+| Assertion | With Skill | Without Skill |
+|-----------|:---------:|:------------:|
+| Detecta ausencia de US/PRD | PASS | PASS |
+| Pergunta ao usuario | PASS | FAIL |
+| Nao inventa US ficticias | PASS | PASS |
+| Nome em kebab-case | PASS | FAIL |
+| Processo interativo | PASS | FAIL |
+## Analise
+### Pontos Fortes da Skill
+1. **Processo interativo**: A skill garante interacao step-by-step (93% vs 33% pass rate)
+2. **Proporcionalidade**: 6 tasks para feature simples vs 12 sem skill
+3. **Guardrails**: Detectou e perguntou sobre US/PRD ausentes em vez de ignorar
+4. **Template e rastreabilidade**: Segue template oficial e mapeia User Stories
+5. **Separacao de documentos**: task_plan como referencia, tasks em arquivos individuais
+### Ponto de Melhoria Identificado
+1. **Leitura de rules do projeto (a4)**: A skill instrui "Ler as rules do projeto", mas o agente leu extensivamente o codebase sem ler `.claude/rules/` e `CLAUDE.md` explicitamente. Sugestao: reforcar na skill que a leitura de rules e o PRIMEIRO passo, antes de explorar o codebase.
+### Custo da Skill
+- **+41.7% tokens**: Esperado — a skill faz mais trabalho (leitura de templates, processo interativo, exploração de codebase mais detalhada)
+- **+22.3% duracao**: Overhead moderado, aceitavel dado o ganho de qualidade
+### Assertions Nao-Discriminantes
+- "Nao inventa US ficticias" passou em ambas as configuracoes (with/without skill) — o modelo base ja respeita isso
+- "Nao inicia execucao automatica" tambem passou em ambas
+### Conclusao
+A skill melhora drasticamente a qualidade do output (+60pp pass rate). O unico ponto de falha (leitura de rules) e um refinamento menor. O custo adicional em tokens/tempo e justificado pelo ganho em estrutura, interatividade e conformidade com o framework SDD.

package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/eval_metadata.json ADDED Viewed

@@ -0,0 +1,12 @@
+{
+  "eval_id": 1,
+  "eval_name": "happy-path-spec-tech-usuario",
+  "prompt": "Gere o TASK PLAN para a feature de usuario. O SPEC_TECH aprovado esta em docs/feature-user/v1/spec_tech.md",
+  "assertions": [
+    {"id": "a1", "text": "Extrai o nome da feature do SPEC_TECH e confirma com o usuario antes de prosseguir", "type": "llm_judge"},
+    {"id": "a2", "text": "Faz apenas UMA pergunta por vez (nao bombardeia com multiplas perguntas no mesmo turno)", "type": "llm_judge"},
+    {"id": "a3", "text": "Propoe macro-fases de alto nivel e aguarda validacao antes de criar tasks", "type": "llm_judge"},
+    {"id": "a4", "text": "Le as rules do projeto (.claude/rules/ e CLAUDE.md) ANTES de gerar tasks", "type": "llm_judge"},
+    {"id": "a5", "text": "NAO inicia execucao automatica de tasks — apenas apresenta o plano e aguarda", "type": "llm_judge"}
+  ]
+}

package/frameworks/skills/sdd-task-plan-expert-workspace/iteration-1/eval-1-happy-path/with_skill/grading.json ADDED Viewed

@@ -0,0 +1,32 @@
+{
+  "eval_id": 1,
+  "eval_name": "happy-path-spec-tech-usuario",
+  "configuration": "with_skill",
+  "expectations": [
+    {
+      "text": "Extrai o nome da feature do SPEC_TECH e confirma com o usuario antes de prosseguir",
+      "passed": true,
+      "evidence": "Extraiu 'Modulo de Usuario -- Vakinha Burger', normalizou para 'feature-user' em kebab-case, e perguntou: 'Podemos iniciar a definicao macro das fases? Voce concorda com esta estrutura de 5 fases?'"
+    },
+    {
+      "text": "Faz apenas UMA pergunta por vez (nao bombardeia com multiplas perguntas no mesmo turno)",
+      "passed": true,
+      "evidence": "Fez apenas uma pergunta ao final: 'Podemos iniciar a definicao macro das fases?' Nao bombardeou com multiplas perguntas."
+    },
+    {
+      "text": "Propoe macro-fases de alto nivel e aguarda validacao antes de criar tasks",
+      "passed": true,
+      "evidence": "Propos 5 fases (Fundacao, Contratos/Dados, Logica de Negocio, Apresentacao, Testes) com justificativa para cada uma, e aguardou validacao antes de criar tasks detalhadas."
+    },
+    {
+      "text": "Le as rules do projeto (.claude/rules/ e CLAUDE.md) ANTES de gerar tasks",
+      "passed": false,
+      "evidence": "O transcript mostra leitura extensiva do codebase (13 arquivos Go, proto, config, PRD), mas NAO ha leitura explicita de .claude/rules/ nem CLAUDE.md. O agente explorou o codebase mas nao leu as rules do projeto."
+    },
+    {
+      "text": "NAO inicia execucao automatica de tasks — apenas apresenta o plano e aguarda",
+      "passed": true,
+      "evidence": "Encerrou com 'Este e o primeiro turno de interacao' e explicou que o proximo passo seria destrinchar tasks da Fase 1. Nao iniciou execucao automatica."
+    }
+  ]
+}