npm - product-runner - Versions diffs - 0.5.0 - Mend

product-runner 0.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (37) hide show

package/README.md +165 -0
package/common/agents/README.md +68 -0
package/common/agents/agente-conceituacao.md +141 -0
package/common/agents/agente-documentacao-funcional.md +107 -0
package/common/agents/agente-gerador-spec.md +106 -0
package/common/agents/agente-kickoff.md +121 -0
package/common/agents/agente-prod-runner.md +107 -0
package/common/agents/agente-review-code.md +97 -0
package/common/agents/agente-review-llm.md +94 -0
package/common/agents/agente-review-product.md +98 -0
package/common/agents/agente-user-review.md +99 -0
package/common/agents/protocolo-de-gates.md +51 -0
package/common/claude-md.template.md +210 -0
package/common/design-principles.md +229 -0
package/common/lessons-learned.md +440 -0
package/common/pipeline.md +143 -0
package/common/spec-guide.md +327 -0
package/common/specs/_open-issues.md +46 -0
package/common/specs/_overview.md +75 -0
package/dist/cli.js +187 -0
package/dist/migrations.js +147 -0
package/dist/scaffold.js +276 -0
package/dist/update.js +400 -0
package/migrations/0.3.0.md +54 -0
package/migrations/0.4.0.md +76 -0
package/migrations/0.5.0.md +55 -0
package/migrations/README.md +68 -0
package/package.json +41 -0
package/profile-cli/README.md +54 -0
package/profile-cli/claude-md.extension.md +102 -0
package/profile-cli/code-patterns.md +363 -0
package/profile-ssr/DESIGN-SYSTEM.md +795 -0
package/profile-ssr/README.md +51 -0
package/profile-ssr/api-patterns.md +70 -0
package/profile-ssr/claude-md.extension.md +113 -0
package/profile-ssr/code-patterns.md +175 -0
package/profile-ssr/ui-patterns.md +97 -0

package/common/lessons-learned.md ADDED Viewed

@@ -0,0 +1,440 @@
+# Lições aprendidas — Projeto DocManager
+Compilado de lições extraídas do desenvolvimento do DocManager,
+organizadas por etapa. Cada lição inclui o contexto em que se aplica
+e por que importa.
+---
+## Etapa 1 — Levantamento de requisitos
+### Pesquisar soluções prontas antes de decidir por custom
+**Quando se aplica:** sempre que o problema parecer comum (gestão documental, CRM, e-commerce).
+**Por que importa:** evita reinventar a roda. Mas também evita forçar uma ferramenta que não cabe — no nosso caso, Paperless-ngx cobria 60% mas os 40% restantes exigiriam mais customização do que construir do zero.
+### Entender orçamento de serviços externos cedo
+**Quando se aplica:** projetos que dependem de APIs pagas (OCR, AI, cloud).
+**Por que importa:** não é só o orçamento geral do projeto — são custos recorrentes mensais que impactam a viabilidade técnica. Google Vision a $1.50/1000 páginas cabe no budget; AWS Textract a $15/1000 não caberia.
+### Perguntas fechadas aceleram o levantamento
+**Quando se aplica:** sempre que estiver levantando requisitos com o usuário.
+**Por que importa:** múltipla escolha força decisão imediata em vez de discussão aberta. O levantamento do DocManager levou 3 rodadas de perguntas em vez de uma conversa livre de 2 horas.
+### Ordem importa: problema/contexto → viabilidade → arquitetura
+**Quando se aplica:** início de qualquer projeto.
+**Por que importa:** decidir stack antes de entender o problema leva a decisões enviesadas. Primeiro entender o que precisa ser resolvido, depois avaliar o que é viável, depois como construir.
+---
+## Etapa 2 — Escolha de stack e arquitetura
+### Mapear o que o framework NÃO faz
+**Quando se aplica:** ao escolher plataforma de deploy ou framework.
+**Por que importa:** as limitações definem a arquitetura tanto quanto as features. Next.js não suporta storage persistente + background jobs na Vercel → descartou Vercel, definiu Docker + VPS. Essa decisão cascateia pra toda a infra.
+### Arquitetura iterativa, não solução fechada
+**Quando se aplica:** ao definir arquitetura com o time/usuário.
+**Por que importa:** apresentar proposta inicial, ouvir contra-propostas, refinar. As melhores decisões do DocManager (services desacoplados, Zod entity como raiz) vieram de sugestões do usuário, não do planejamento inicial.
+### Documentar o "porquê" de cada decisão
+**Quando se aplica:** qualquer decisão de arquitetura, stack ou design.
+**Por que importa:** sem o "porquê", as decisões são revisitadas toda vez que alguém novo chega ou que surge uma dúvida. "Usamos registros no banco pra campos de padrão PORQUE precisamos de consultas transversais" fecha a discussão.
+---
+## Etapa 3 — Modelo de dados
+### Modelar junto com o usuário
+**Quando se aplica:** definição de entities e relações.
+**Por que importa:** gaps conceituais que o técnico não vê. No DocManager, o usuário identificou que faltava DocumentLink (relação doc↔doc) e campos repetíveis (itens de NF) — dois conceitos que o técnico não teria percebido sozinho.
+### Decisões conceituais antes do schema
+**Quando se aplica:** antes de escrever qualquer modelo Prisma/SQL.
+**Por que importa:** "um documento pertence a uma ou muitas categorias?", "campos como registros ou JSON?", "enum ou booleanos?" — essas decisões definem TUDO. Errar aqui propaga pra todas as camadas.
+### ERD visual pra alinhar entendimento
+**Quando se aplica:** sempre que o modelo tiver mais de 5 entities.
+**Por que importa:** texto descreve relações sequencialmente. Diagrama mostra todas as relações de uma vez. O momento "ah, falta uma seta aqui" só acontece quando você vê o diagrama.
+### Validar modelo completo antes de implementar
+**Quando se aplica:** antes de criar a primeira migration.
+**Por que importa:** é a fundação. Erro no modelo propaga pra services, API, UI. Adicionar uma entity depois é fácil; mudar uma relação fundamental depois é caro.
+---
+## Etapa 4 — Dev workflow e spec-first
+### Spec-first economiza mais tempo do que parece
+**Quando se aplica:** qualquer projeto com implementação assistida por AI.
+**Por que importa:** o Claude Code com spec clara implementa em minutos o que levaria horas sem contexto. A spec é o "prompt" perfeito porque tem tudo: contexto, entities, funções, API, UI, critérios de aceite.
+### Granularidade certa é crucial
+**Quando se aplica:** ao escrever specs.
+**Por que importa:** spec grande demais → Claude Code perde foco e gera código inconsistente. Spec pequena demais → overhead de gestão, muitas sessões. Regra: uma spec = uma sessão de Claude Code.
+### Fases com corte vertical, não horizontal
+**Quando se aplica:** ao planejar fases de entrega.
+**Por que importa:** "modelo → services → API → UI" (horizontal) entrega valor só no final. "Upload + OCR + visualização de ponta a ponta" (vertical) entrega valor visível na Fase 1. O usuário vê resultado e valida cedo.
+### Overview com grafo de dependências
+**Quando se aplica:** projetos com mais de 5 specs.
+**Por que importa:** evita implementar specs fora de ordem. "Org/03 depende de org/01" — sem o grafo, alguém pode tentar implementar referências antes de categorias existirem.
+### Critérios de aceite binários
+**Quando se aplica:** toda spec.
+**Por que importa:** eliminam ambiguidade do "pronto". "Consigo arrastar 10 fotos e todas são salvas" — ou passa ou não passa. Sem "parcialmente implementado".
+### Documentar o princípio de entrega vertical
+**Quando se aplica:** ao criar o overview de fases.
+**Por que importa:** a lista de fases mostra a ordem, mas não o porquê. Sem documentar o princípio, alguém replicando pode organizar horizontalmente sem perceber que foi uma escolha deliberada.
+---
+## Etapa 5 — Skills e documentação
+### Menos skills melhores > muitas skills rasos
+**Quando se aplica:** ao montar estratégia de skills/docs.
+**Por que importa:** 1 CLAUDE.md completo + docs de referência supera 9 CLAUDE.md espalhados. Manutenção de 9 arquivos sincronizados é overhead que não compensa.
+### Conhecer o formato de cada ferramenta antes de gerar artefatos
+**Quando se aplica:** ao criar skills, configs, templates pra ferramentas.
+**Por que importa:** o Cowork exige YAML frontmatter nas skills. Gerar sem e descobrir pelo erro custou retrabalho. Verificar o formato esperado antes de gerar evita isso.
+### Divisão de responsabilidade entre ferramentas deve ser explícita
+**Quando se aplica:** projetos que usam múltiplas ferramentas AI.
+**Por que importa:** sem definição clara, você mistura — pede pro chat o que o Cowork faz melhor, ou pro Claude Code o que é um fix do Cowork. Definir no kickoff: chat = pensar, Cowork = agir nos arquivos, Code = implementar.
+### Padrão de comunicação entre ferramentas
+**Quando se aplica:** workflow multi-ferramenta.
+**Por que importa:** "discutir aqui → instrução copiável → cola lá" surgiu organicamente mas deveria ser definido no kickoff. Sem esse padrão, cada handoff é improvisado.
+### Regras operacionais no CLAUDE.md fazem diferença real
+**Quando se aplica:** qualquer projeto com Claude Code.
+**Por que importa:** "3 strikes", "spec vs realidade técnica", "fixes não precisam de spec" — todas surgiram de problemas reais. Sem elas, loops e decisões subótimas repetem.
+---
+## Etapa 6 — Ciclo de implementação
+### Claude Code precisa de guardrails comportamentais
+**Quando se aplica:** qualquer projeto com Claude Code.
+**Por que importa:** ele é excelente executor mas sem guardrails entra em loops (searchVector), segue spec literalmente quando há alternativa melhor (rowIndex null), e não para pra perguntar quando deveria.
+### O report final do Claude Code é o artefato mais valioso
+**Quando se aplica:** após cada sessão de implementação.
+**Por que importa:** critérios ✅/❌ + decisões de implementação + notas do que não testou = tudo que precisa pra review e documentação retroativa. Sem ele, você não sabe o que mudou.
+### Divergências spec↔código devem ser documentadas
+**Quando se aplica:** após cada implementação.
+**Por que importa:** se a spec diz X e o código faz Y (por bom motivo), documentar na seção "Decisões de implementação" da spec. Senão a spec vira mentira e perde valor como referência.
+### Validação visual no browser é insubstituível
+**Quando se aplica:** qualquer feature com UI.
+**Por que importa:** tsc --noEmit pega erros de tipo mas não de comportamento. Um filtro que não aplica, um botão que não navega, um layout quebrado — só vê testando no browser.
+### Fixes pequenos vão direto, sem spec
+**Quando se aplica:** bugs, ajustes visuais, links faltando.
+**Por que importa:** criar spec pra corrigir um link é overhead. Regra: se altera entity, cria service, adiciona endpoint ou cria tela → spec. Se é correção do que já deveria funcionar → fix direto.
+### Port fixo + report do port real
+**Quando se aplica:** projetos com dev server local.
+**Por que importa:** port mudando entre sessões (3000 vs 3001) causa confusão. Fixar no package.json e documentar que o Claude Code deve reportar o port real no output.
+---
+## Etapa 7 — Evolução durante o projeto
+### O processo deve suportar evolução aditiva
+**Quando se aplica:** qualquer projeto que vai durar mais de uma semana.
+**Por que importa:** specs novas, alterações em existentes, regras novas no CLAUDE.md — tudo deve ser aditivo, nunca destrutivo. A arquitetura "nullable pra evolução" se provou: nenhuma mudança exigiu migração destrutiva.
+### Usar o sistema real expõe gaps
+**Quando se aplica:** sempre.
+**Por que importa:** as melhores melhorias do DocManager vieram de testar com dados reais: campos repetíveis surgiram ao configurar padrões, DATETIME ao pensar em tipos de data. Nenhum planejamento abstrato teria pego isso.
+### Formatter desde o dia zero, linting customizado depois
+**Quando se aplica:** setup de qualquer projeto.
+**Por que importa:** Prettier + lint-staged + husky no setup/01 — custo mínimo, evita reformatação retroativa. Regras de linting customizadas (services não importam de Next, etc) entram quando as convenções se consolidam.
+### CLAUDE.md é documento vivo
+**Quando se aplica:** durante todo o projeto.
+**Por que importa:** regras operacionais surgem de problemas reais durante o desenvolvimento. Adicionar conforme aparecem, não tentar prever tudo no início.
+### Modelar pra evolução > modelar "completo"
+**Quando se aplica:** design de modelo de dados.
+**Por que importa:** campos nullable, enums extensíveis, constraints aditivos. Mais importante que acertar tudo de primeira é garantir que mudanças futuras não quebrem o existente.
+---
+## Etapa 8 — Retrospectiva
+### Retrospectiva é etapa formal, não opcional
+**Quando se aplica:** ao final de cada fase ou do projeto.
+**Por que importa:** se não parar pra fazer, as lições ficam na conversa e se perdem. A retrospectiva deve gerar artefatos concretos (este documento, templates, regras novas).
+### Fazer retro com a mesma ferramenta preserva contexto
+**Quando se aplica:** ao planejar a retrospectiva.
+**Por que importa:** reconstruir de memória perde nuances. Fazer na mesma conversa que conduziu o projeto permite referenciar decisões com contexto real.
+---
+## Notas exploratórias
+### Arquivo compartilhado como barramento entre agentes
+Explorar uso de `inbox/instructions.md` como meio de comunicação
+entre Claude.ai e Cowork — tanto pra instruções quanto pra outputs.
+Evita copy-paste manual. Não validado ainda.
+### Estrutura multi-agente de referência
+Setup mais poderoso possível com ferramentas atuais:
+- Cowork = orquestrador (arquivos + Chrome connector)
+- Claude Code = implementador (Agent Teams + Chrome)
+- Claude.ai = arquiteto (sem conexão direta — humano é ponte)
+### Chrome como ponte automática
+Testar Claude in Chrome lendo a aba do Claude.ai como ponte.
+Promissor mas frágil — não recomendar como prática padrão
+até validar em projetos reais.
+### Regras de lint customizadas pro DocManager
+Avaliar adicionar: services não importam de `next`,
+API routes não importam do Prisma direto,
+schemas derivam da entity base.
+---
+*Documento gerado ao final do projeto DocManager como parte
+da retrospectiva. Cada lição tem contexto real — não são
+"boas práticas genéricas" mas aprendizados de problemas
+que aconteceram.*
+---
+# Lições adicionais — projeto tradeBot (2026-05)
+Aprendizados extraídos do refactor incremental do tradeBot.
+Complementam ou refinam as lições do DocManager.
+## Etapa 9 — LLM como executor
+### Princípios técnicos vs princípios LLM-first vs valores
+**Quando se aplica:** ao escrever [design-principles](./design-principles.md).
+**Por que importa:** tratar tudo como "princípios" mistura regras
+acionáveis com filosofia. Separação em 3 categorias:
+- **Técnicos** (4): regras universais de arquitetura.
+- **LLM-first** (5): regras específicas pra trabalho com LLM como executor.
+- **Valores não-acionáveis** (2): cultura, sem critério binário.
+LLM lê critério binário > regra textual.
+### Critérios meta padrão (M1, M2, M3)
+**Quando se aplica:** toda spec.
+**Por que importa:** regras textuais em CLAUDE.md são esquecidas
+durante a sessão. Critério em checklist é checkpoint binário.
+- **M1**: Decisões de implementação preenchidas com substância.
+- **M2**: Decisões técnicas explicitadas em thinking.
+- **M3**: Release checklist com símbolos ✅/❌/⚠️ por item.
+### Template literal > exemplo aspiracional
+**Quando se aplica:** instruir formato de output do Code (ex: M3).
+**Por que importa:** "o output deve seguir esse formato:" + bloco
+de código fixo é copiado e preenchido. Exemplo aspiracional sem
+"Code DEVE reportar usando este formato" é ignorado.
+### Mudanças adjacentes vão pra outra spec
+**Quando se aplica:** durante implementação de qualquer spec.
+**Por que importa:** preserva o binário "passou/falhou", esconde
+menos escopo, mantém rastreabilidade. Bug ou refactor tentador
+visto durante implementação NÃO entra na spec atual — anota em
+"Decisões de implementação" e abre spec separada se relevante.
+### `_open-issues.md` como ponte entre regra e esquecimento
+**Quando se aplica:** projeto com mais de 3-4 specs.
+**Por que importa:** "anotar e adiar" precisa de lugar central,
+não enterrado em decisões de spec. Cada item exige "Candidato a
+endereçamento" explícito — sem isso, vira lixo.
+### Smoke check em código > pendente humano
+**Quando se aplica:** quando bug é detectável programaticamente.
+**Por que importa:** "pendente humano" significa "ninguém vai
+rodar". Bug pode passar silencioso. Quando possível (round-trip,
+fixture conhecida), critério vira teste programático.
+### Pragmatismo controlado: escape hatch tem destino
+**Quando se aplica:** ao aceitar `as any`, `// @ts-ignore`, etc.
+**Por que importa:** LLM aceita escape hatches com facilidade.
+Aviso explícito: qualquer escape hatch DEVE ser documentado em
+"Decisões de implementação" + ter candidato a endereçamento futuro.
+Sem destino, vira dívida invisível.
+### Limite numérico funciona como guardrail
+**Quando se aplica:** ao prescrever ajustes em código existente.
+**Por que importa:** "se ajuste exigir mexer em mais de 5 lugares,
+parar" é mais efetivo que "menor superfície" abstrato. LLM consegue
+contar. Dá um número.
+### Mock pesado pra contornar acoplamento estrutural é anti-padrão
+**Quando se aplica:** ao testar função que importa módulo com
+side-effects.
+**Por que importa:** quando o teste precisa de >2 mocks pra carregar
+o módulo, o problema é a estrutura, não o teste. Solução é refactor
+estrutural, não mais mocks. Caso clássico: side-effects no top-level
+do entrypoint.
+### Verificar side-effects no top-level antes de prescrever import em teste
+**Quando se aplica:** ao escrever spec que prescreve `export` de
+função existente pra testar.
+**Por que importa:** se o módulo de origem tem `process.exit`,
+`new Client(...)`, `run().catch(...)` no top-level, importar em teste
+vira rabbit hole. Opções: extrair função pra arquivo próprio, ou
+adiar teste pra spec posterior.
+## Etapa 10 — Trabalho com snapshots e templates vivos
+### Templates vivos > snapshots zero
+**Quando se aplica:** ao acumular padrões de múltiplos projetos.
+**Por que importa:** snapshot por projeto preserva histórico.
+Templates separados, versionados em git, mantêm o estado da arte
+atualizável. Os dois são complementares — não substitutos.
+### "Fix definitivo" prematuro pode ser falso
+**Quando se aplica:** ao fechar issue assumindo que causa raiz
+foi resolvida.
+**Por que importa:** se o sintoma reaparece em outro contexto,
+o fix não era definitivo. Marcar issue como FECHADA exige observar
+em pelo menos 2 sessões sem retorno do sintoma.
+### Padrão port/adapter cabe em projeto pequeno
+**Quando se aplica:** projeto com lib externa cuja interface deve
+ser isolada (broker, DB, AI APIs).
+**Por que importa:** custo inicial baixo (~80 linhas) destrava
+testabilidade, validação de respostas, e flexibilidade pra trocar
+implementação. Não é overkill mesmo em projetos pequenos.
+### `.passthrough()` em Zod resolve "campos extras pra log"
+**Quando se aplica:** validação de respostas de APIs externas
+onde a lógica usa só alguns campos mas log/observability quer todos.
+**Por que importa:** schema valida campos críticos, runtime mantém
+o resto. Tipo inferido fica estrito; cast pra index signature
+quando necessário.
+### `outDir` separado desde o início
+**Quando se aplica:** projeto com `tsc` + Vitest (ou similar).
+**Por que importa:** `tsc` gerando `.js` ao lado de `.ts` causa
+conflito recorrente — Node prefere `.js` na resolução. Custo de fix
+tardio: sessões bloqueadas por arquivos stale. Configurar
+`outDir: ./dist/` desde a primeira sessão.
+### Múltiplas leituras fragmentadas do mesmo arquivo
+**Quando se aplica:** Code lendo arquivo grande com offsets
+diferentes.
+**Por que importa:** custo de round-trips agregado supera custo
+de uma leitura única. Antes de múltiplos `Read` com offsets,
+considerar `limit: 2000` em uma única chamada.
+### Limite de "tudo numa spec" pode estourar mas vale aceitar
+**Quando se aplica:** specs de refactor estrutural maior (mover
+muitos arquivos).
+**Por que importa:** spec-guide diz ~80-150 linhas. Refactor que
+move 10+ funções com testes inevitavelmente passa de 200. Aceitar
+quando o escopo é coeso é melhor que dividir em sub-specs que
+violam "fases verticais entregam valor".
+---
+*Lições adicionais extraídas do tradeBot. Padrão: cada lição tem
+contexto, "quando se aplica", "por que importa" — não é máxima
+abstrata.*
+---
+# Lições adicionais — projeto painel (2026-06)
+Aprendizados do **trade-bot-painel**, o 3º projeto. Aqui o **pipeline de
+agentes** ([pipeline](./pipeline.md)) rodou de ponta a ponta pela 1ª vez (conceituação →
+documentação funcional → geração de spec → implementação) no Incremento 1.
+## Etapa 11 — Pipeline de agentes (conceituação → spec)
+### Separar conceituação de geração de spec paga
+**Quando se aplica:** projeto novo de produto, não mudança pequena.
+**Por que importa:** a conceituação (`agente-conceituacao`) produz um LDoc
+estável (dor, casos de uso, roadmap de incrementos, DER amplo) que vira
+fonte de verdade; o gerador (`agente-gerador-spec`) só **recorta e
+redistribui** isso em specs verticais. Não inventar na geração — se está
+escrevendo do zero algo que já está no LDoc, o corte está errado.
+### LDoc é fonte da verdade; HDoc deriva estrito
+**Quando se aplica:** qualquer artefato de documentação do pipeline.
+**Por que importa:** o `.md` para LLM (LDoc) é editado; o doc humano (HDoc)
+é sempre regerado dele, nunca editado à mão. Tutorial e exemplos moram no
+LDoc (não só no HDoc) — servem ao gerador de spec como referência de
+comportamento. Evita duas fontes divergindo.
+### Protocolo de gates > regra de gate em prosa
+**Quando se aplica:** qualquer ponto de confirmação humana num agente.
+**Por que importa:** os agentes "declaravam rigor e cediam a um ok genérico"
+em ponto de alto risco. Externalizar para [protocolo-de-gates](./agents/protocolo-de-gates.md) (alto
+risco = lista numerada, "ok" genérico não fecha, valores verificáveis =
+alto risco automático) é o mesmo aprendizado dos critérios meta — checklist
+binário vence atenção. Limite honesto: mais forte que prosa, não à prova
+de falha.
+### Roadmap por incremento, estável mas não congelado
+**Quando se aplica:** projeto que entrega em fatias de produto.
+**Por que importa:** detalhar só o Incremento 1 em alta resolução e manter
+os demais em baixa (nome + valor + UCs) evita compromisso prematuro. O
+re-entry (detalhar o próximo incremento) inclui um checkpoint "o macro
+ainda vale?" — captura aprendizado sem repetir o diálogo macro.
+### Schema frouxo ≠ dado ausente
+**Quando se aplica:** ao cortar/justificar spec a partir de schemas.
+**Por que importa:** `z.array(z.unknown())` significa "forma ainda não
+tipada", não "o dado é vazio". No painel, `buyStack`/`sellStack` estavam
+`z.unknown()` (vazios na amostra) — quando o dado real apareceu, o shape
+foi determinado e as specs `monitor/01` e `03` tiparam. Tratar forma do
+schema como forma, nunca como evidência sobre presença/conteúdo do dado.
+### Confronto com dado real reconcilia o DER amplo
+**Quando se aplica:** geração de spec quando há exemplo real do dado.
+**Por que importa:** o DER amplo (raso, por decisão) supôs `orderId` como
+`string`; o JSON real tinha `number`. As specs corrigiram (fonte de verdade
+= dado real) e registraram a divergência pra reconciliação a jusante. Não
+infira a forma do dado da conceituação quando há o dado na mão.
+### Docs de orientação descasam do roadmap real — reconciliar cedo
+**Quando se aplica:** quando o pipeline reorganiza o trabalho (ex.: de
+domínio `tradebot/` para incremento `monitor/`).
+**Por que importa:** `_overview`, `CLAUDE.md` (tabela de estado) e o doc de
+entrada passam a mentir sobre "qual a próxima spec". A spec em si é
+autocontida (não bloqueia), mas o roadmap desatualizado confunde. Issue de
+roadmap precisa de candidato e fechamento, igual bug.
+### Status se lê do conteúdo, não do índice
+**Quando se aplica:** ao responder "em que etapa estamos / qual a próxima"
+ou "X está pronto?", tipicamente ao orientar no início de uma sessão.
+**Por que importa:** numa sessão de orientação o agente respondeu a partir
+das tabelas de status (`_overview`, tabela de estado do `CLAUDE.md`) — lidas
+ainda por cima **truncadas** (`head -N`) — sem abrir nenhuma spec. Dois
+estragos: (1) quase repassou a divergência do índice (que driftou, ver lição
+acima) como verdade; (2) confundiu "Decisões de implementação preenchidas"
+(rastro do **estágio 4**, por M1) com "review feito" (**estágio 5**, que tem
+rastro próprio — o veredito do Review.Code), e por isso não viu que o próximo
+passo era **rodar os fluxos de review**. O índice é HDoc do status: derivado
+e sujeito a drift; a fonte é o **conteúdo da spec**. Regra: status se
+descobre pelo **rastro nos artefatos** (tabela em [pipeline](./pipeline.md), "Em que
+estágio estou?"), nunca da tabela de status, nunca de leitura truncada.
+Mesma raiz da lição anterior, agora no ato de **orientar**, não de
+implementar — e por isso a correção foi tornar o procedimento explícito no
+`CLAUDE.md`/`pipeline`, não só descrever a falha.
+### Briefing congelado precisa de nota, não de reescrita
+**Quando se aplica:** quando um snapshot canônico (ex.: `Kickoff.md`) fica
+obsoleto.
+**Por que importa:** reescrever um doc deliberadamente congelado apaga
+história e contradiz a decisão de congelá-lo. Uma nota no topo apontando o
+roadmap vigente resolve a confusão sem perder o snapshot.
+---
+*Lições do painel. O pipeline de agentes teve aqui sua 1ª validação real —
+tratar como método vivo, não consolidado, até acumular mais runs.*

package/common/pipeline.md ADDED Viewed

@@ -0,0 +1,143 @@
+# Pipeline de desenvolvimento
+Como uma ideia vira código neste método. É a **espinha** que conecta o
+discovery, os agentes de conceituação/documentação/spec ([agents/](./agents/README.md)),
+o protocolo de gates e o ciclo Cowork↔Claude Code do [spec-guide](./spec-guide.md).
+## Visão geral
+```
+0 discovery → 1 conceituação → 2 doc-funcional → 3 gerador-spec → 4 Claude Code → 5 review
+  (kickoff)     (reqs/ldoc+hdoc)  (como-funciona)    (specs/)        (código+report)    │
+                      └────────────── protocolo-de-gates governa os gates ───────────┘  │
+                                                                                         ↓
+5 · review (sub-cadeia):  Review.Code → User Review → Review.Product → Review.LLM
+                          (veredito)    (uso humano)   (roteia)        (corrige pipeline)
+                             └─ Impeditivo escala: User Review → Review.Product → Conceituação
+```
+## Os estágios
+**0 · Discovery / kickoff** — [agente-kickoff](./agents/agente-kickoff.md). Entender o problema antes da
+solução: build-vs-buy, orçamento de serviços externos, o que o framework
+NÃO faz, volume, decisões de stack e **esboço** de modelo de dados. A porta
+de entrada humana é a skill `project-kickoff` (quando instalada) ou `npx
+product-runner init`; o [agente-kickoff](./agents/agente-kickoff.md) é a diretriz
+versionada do estágio, copiada para `docs/agents/` no scaffold. Saída:
+decisões consolidadas num briefing (ex.: `Kickoff.md`) + perfil escolhido.
+**1 · Conceituação** — [agente-conceituacao](./agents/agente-conceituacao.md). Dor→conceito: diagrama de
+conceitos, casos de uso, roadmap de incrementos (baixa resolução), DER
+amplo, e o **Incremento 1 detalhado** (estrutura de dados, sequências,
+exemplo com critérios). Gates 1 · 1.5 · 2 · 3. Saída: `reqs/ldoc.md` +
+`reqs/hdoc.md`.
+**2 · Documentação funcional** — [agente-documentacao-funcional](./agents/agente-documentacao-funcional.md). Como a
+aplicação funciona e como usar, em tom presente. Roda por incremento,
+antes da spec. Saída: `funcional/como-funciona.ldoc.md` + `.hdoc.md`.
+**3 · Geração de spec** — [agente-gerador-spec](./agents/agente-gerador-spec.md). Corta o incremento em N
+specs verticais no template do [spec-guide](./spec-guide.md), redistribuindo os artefatos
+a montante. Gate de corte (alto risco). Saída: `specs/{domínio}/NN.md` +
+[_overview](../specs/_overview.md) + [_open-issues](../specs/_open-issues.md).
+**4 · Implementação** — Claude Code, **uma spec por sessão**: lê
+[CLAUDE.md](../CLAUDE.md) → a spec → os `docs/` referenciados →
+implementa → reporta (critérios ✅/❌ + decisões). Detalhe do ciclo e das
+regras operacionais no [spec-guide](./spec-guide.md).
+**5 · Review** — sub-cadeia própria, rodada **por incremento entregue**,
+um agente por papel ([agents/](./agents/README.md)):
+1. **Review.Code** ([agente-review-code](./agents/agente-review-code.md)) — review técnico: cruza
+   cada critério de aceite com o **código real** (grep, testes, diff), não
+   com o report. Rastro: veredito ✅/❌/⚠️ por critério + classificação dos
+   achados (correção do ciclo / issue / Impeditivo). Divergências legítimas
+   são apontadas para as "Decisões de implementação" da spec — ele não
+   reescreve a spec.
+2. **User Review** ([agente-user-review](./agents/agente-user-review.md)) — prepara o teste de
+   usabilidade (roteiro) e trata o feedback (corte binário ajuste /
+   mais-que-ajuste). O julgamento é humano e intransferível. Roda após o
+   Review.Code.
+3. **Review.Product** ([agente-review-product](./agents/agente-review-product.md)) — hub: classifica
+   o feedback por **causa-raiz** e roteia ao destino (Conceituação,
+   Doc-funcional, Design System ou Review.LLM). Acumula a fila de produto.
+4. **Review.LLM** ([agente-review-llm](./agents/agente-review-llm.md)) — meta: a partir de uma
+   falha **já diagnosticada com o humano**, corrige o **próprio pipeline**
+   (diretiva, skill, template) pra ela não repetir, e reconcilia a mesma
+   inconsistência se ela propagou.
+**Impeditivo** (concepção profunda achada no Review.Code) bloqueia o avanço
+e escala por User Review → Review.Product → Conceituação; só o humano
+bypassa. A **volta de reconciliação** (corrigir conceituação/funcional
+contra o que foi construído) é coberta por Review.Product → destino — antes
+era fase futura, agora está especificada nos agentes. Tratar como
+recém-especificado: método vivo até acumular runs.
+## Em que estágio estou? (orientar pelo rastro)
+"Qual a próxima etapa" / "X está pronto?" se descobre **lendo o conteúdo
+dos artefatos**, não a tabela de status. Cada estágio deixa um **rastro**
+detectável; o **primeiro estágio sem rastro é o próximo passo**:
+| Estágio | Rastro de que rodou |
+| --- | --- |
+| 1 conceituação | `reqs/ldoc.md` existe e preenchido |
+| 2 doc-funcional | `funcional/como-funciona.ldoc.md` existe |
+| 3 gerador-spec | `specs/{domínio}/NN.md` existem + `_overview` populado |
+| 4 implementação | report do Code (critérios ✅/❌/⚠️) + **"Decisões de implementação" preenchidas** (critério M1) |
+| 5 review | **veredito do Review.Code** (cruzamento critério × código) + saídas de User/Product/LLM (filas de produto/meta) |
+> **Cuidado — o erro clássico:** "Decisões de implementação" preenchidas
+> são rastro do **estágio 4** (Code as preenche por M1), **não** do review.
+> O estágio 5 tem rastro **próprio** (o veredito do Review.Code). Ver uma
+> spec com Decisões preenchidas e concluir "review feito" é confundir os
+> dois — aconteceu de verdade (ver [lessons-learned](./lessons-learned.md)). Se não há
+> veredito de review, **o próximo passo é rodar os fluxos de review.**
+**Regra de fonte:** a spec é a **fonte**; `_overview.md` e a tabela de
+estado do `CLAUDE.md` são **índice derivado** (mesmo princípio LDoc→HDoc
+abaixo). Confirme o status contra o **conteúdo da spec** antes de afirmar ou
+sugerir o próximo passo. Se o índice diverge da spec, a **spec ganha** e o
+índice é o que se corrige. Nunca responda status a partir de leitura
+truncada (`head -N`) do índice.
+## LDoc / HDoc
+- **LDoc** (`.md`, feito para LLM ler) é a **fonte da verdade** de cada
+  estágio. O **HDoc** é sempre **derivado** do LDoc — nunca editado à mão.
+  Se o humano pede mudança no HDoc, a mudança entra no LDoc e o HDoc é
+  regenerado.
+- **Não são templates de arquivo** — nascem da execução dos agentes no
+  projeto. Convenção de caminhos: `reqs/` (conceituação), `funcional/`
+  (documentação funcional).
+## Gates (transversal)
+[protocolo-de-gates](./agents/protocolo-de-gates.md) é a **fonte canônica** de gate e calibragem por
+stakes: alto risco → lista numerada, "ok" genérico não fecha; valores
+verificáveis (contas, critérios) = alto risco automático. Os critérios
+meta **M1-M3** do [spec-guide](./spec-guide.md) são a **aplicação** desse princípio à
+etapa de spec (checklist binário vence atenção textual — mesmo aprendizado).
+## Pipeline inteiro vs trecho curto
+- **Projeto novo de produto:** pipeline inteiro (0→5). O discovery e a
+  conceituação pagam o custo quando há produto a descobrir.
+- **Mudança pequena / projeto pequeno:** entrar direto no trecho
+  spec→implementa→review (estágios 3-5), sem conceituação formal. O
+  [spec-guide](./spec-guide.md) cobre esse caminho (inclui "fixes vs specs").
+## Onde mora cada coisa
+| Estágio | Ferramenta |
+| --- | --- |
+| Discovery (0) | Skill `project-kickoff` + humano |
+| Conceituação, doc-funcional, gerador-spec, review (1-3, 5) | Cowork (sessão com acesso aos arquivos) |
+| Implementação (4) | Claude Code (sessão dedicada apontando pro repo) |
+| Gates | Transversal — [protocolo-de-gates](./agents/protocolo-de-gates.md) |
+---
+_Método vivo. Validado pela 1ª vez ponta a ponta no **trade-bot-painel**
+(2026-06), Incremento 1. Tratar como hipótese até acumular mais runs._