npm - role-os - Versions diffs - 2.6.0 → 2.7.1 - Mend

role-os 2.6.0 → 2.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (22) hide show

package/CHANGELOG.md +26 -0
package/README.es.md +185 -129
package/README.fr.md +193 -137
package/README.hi.md +191 -135
package/README.it.md +186 -130
package/README.ja.md +191 -135
package/README.md +6 -18
package/README.pt-BR.md +188 -132
package/README.zh.md +192 -139
package/bin/roleos.mjs +10 -0
package/package.json +1 -1
package/src/specialist/budget-consult.mjs +120 -0
package/src/specialist/client.mjs +131 -0
package/src/specialist/dispatch.mjs +237 -0
package/src/specialist/events.mjs +56 -0
package/src/specialist/gate.mjs +202 -0
package/src/specialist/registry.mjs +219 -0
package/src/specialist/shadow.mjs +122 -0
package/src/specialist/state.mjs +125 -0
package/src/specialist-cmd.mjs +378 -0
package/starter-pack/policy/specialist-tier.md +288 -0
package/starter-pack/schemas/specialist.md +155 -0

package/README.pt-BR.md CHANGED Viewed

@@ -13,20 +13,20 @@
   <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
 </p>
-Um sistema operacional multi-Claude que aloca, direciona, valida e executa tarefas por meio de 31 contratos de funções especializadas. Cria pacotes de tarefas, monta a equipe certa com base em correspondência de funções, detecta problemas antes da execução, direciona automaticamente a recuperação quando o trabalho é bloqueado ou rejeitado e exige evidências estruturadas em cada decisão.
+Um sistema operacional multi-Claude que aloca, direciona, valida e executa tarefas por meio de 61 contratos de função especializados. Cria pacotes de tarefas, monta a equipe ideal com base na correspondência de funções, detecta falhas antes da execução, roteia automaticamente a recuperação quando uma tarefa é interrompida ou rejeitada e exige evidências estruturadas em cada verificação. Inclui despacho dinâmico para missões de grande escala — um repositório de 10 componentes se transforma automaticamente em 28 etapas de auditoria, em vez de 6.
 ## O que ele faz
-Role OS é a maneira profissional de usar o multi-Claude. Ele evita as falhas específicas que os fluxos de trabalho de IA genéricos produzem:
+Role OS é a maneira profissional de usar o multi-Claude. Ele previne as falhas específicas que os fluxos de trabalho genéricos de IA produzem:
-- **Desvio (Drift)** — as funções permanecem em seu domínio. O produto não é redesenhado. A interface não redefine o escopo. O backend não inventa a direção do produto.
-- **Conclusão falsa** — a definição de "concluído" é concreta. O trabalho que esconde lacunas, ignora a verificação ou resolve um problema diferente é rejeitado.
-- **Contaminação** — projetos bifurcados ou herdados carregam resíduos de identidade. O Role OS detecta e rejeita desvios entre projetos em termos, visuais e modelos mentais.
-- **Progresso baseado em impressões** — cada transferência é estruturada. Cada veredicto está vinculado a evidências. "Parece pronto" não é um estado válido.
+- **Desvio** — as funções permanecem dentro de seus limites. O produto não é redesenhado. O frontend não redefine o escopo. O backend não inventa a direção do produto.
+- **Conclusão falsa** — a definição de "concluído" é concreta. O trabalho que oculta lacunas, ignora a verificação ou resolve um problema diferente é rejeitado.
+- **Contaminação** — projetos ramificados ou herdados carregam resíduos de identidade. O Role OS detecta e rejeita o desvio entre projetos na terminologia, elementos visuais e modelos mentais.
+- **Progresso baseado em "vibes"** — cada transferência é estruturada. Cada verificação está vinculada a evidências. "Parece concluído" não é um estado válido.
 ## Como funciona
-Descreva sua tarefa. O Role OS decide automaticamente o nível de orquestração adequado.
+Descreva sua tarefa. O Role OS decide automaticamente o nível ideal de orquestração.
 ```bash
 roleos start "fix the crash in save handler"
@@ -42,15 +42,15 @@ roleos start "something completely novel"
 #   Hint: Create a packet and run `roleos route` for role-level routing
 ```
-**A hierarquia de fallback:**
+**A escada de fallback:**
-1. **Missão:** quando a tarefa corresponde a um fluxo de trabalho recorrente comprovado (correção de bugs, tratamento, lançamento de recursos, documentação, segurança, pesquisa). Cadeia de funções conhecida, fluxo de artefatos, ramificações de escalonamento e definições parciais claras.
-2. **Pacote:** quando a tarefa é uma família conhecida, mas não se encaixa em um formato de missão completo. 7 pacotes de equipe calibrados com seleção automática e proteções contra incompatibilidades.
-3. **Direcionamento livre:** quando a tarefa é nova, mista ou incerta. Avalia todas as 31 funções com base no conteúdo do pacote e monta uma cadeia dinâmica.
+1. **Missão** — quando a tarefa corresponde a um fluxo de trabalho recorrente comprovado (correção de bug, tratamento, lançamento de recurso, documentação, segurança, pesquisa, brainstorming, auditoria aprofundada, teste em grupo). Cadeia de funções conhecida, fluxo de artefatos, ramificações de escalonamento e definições honestas e parciais.
+2. **Pacote** — quando a tarefa pertence a uma família conhecida, mas não tem a forma completa de uma missão. 10 pacotes de equipe calibrados com seleção automática e proteções contra incompatibilidades.
+3. **Roteamento livre** — quando a tarefa é nova, mista ou incerta. Avalia todas as 61 funções em relação ao conteúdo do pacote e monta uma cadeia dinâmica.
-O sistema nunca força o trabalho a passar pela camada de abstração incorreta. Ele explica por que escolheu cada nível e oferece alternativas.
+O sistema nunca força o trabalho por meio da abstração errada. Ele explica por que escolheu cada nível e oferece alternativas.
-**Um comando para iniciar a execução:**
+**Um único comando para iniciar a execução:**
 ```bash
 roleos run "fix the crash in save handler"
@@ -77,48 +77,54 @@ roleos block 2 "waiting for API spec"
 roleos reopen 0 "found issue in review"
 ```
-As execuções são persistidas no disco (em `.claude/runs/`), permitindo que as sessões interrompidas sejam retomadas sem problemas. Cada etapa inclui orientações para o operador: o que produzir, as seções necessárias e as condições de parada.
+As execuções são persistidas em disco (`.claude/runs/`), para que as sessões interrompidas sejam retomadas de forma limpa. Cada etapa inclui orientação para o operador: o que produzir, seções necessárias e condições de parada.
-**Depois de direcionado:**
+**Após o roteamento:**
-1. **Cada função produz uma transferência:** saída estruturada com itens de evidência que reduzem a ambiguidade para a próxima função.
-2. **O revisor avalia em relação ao contrato:** aceita, rejeita ou bloqueia com base em evidências estruturadas, e não em impressões.
-3. **A recuperação é direcionada automaticamente:** o trabalho bloqueado ou rejeitado é direcionado ao resolvedor correto, com um motivo, tipo de recuperação e artefato necessário.
+1. **Cada função produz uma transferência** — saída estruturada com itens de evidência que reduzem a ambiguidade para a próxima função.
+2. **O crítico avalia em relação ao contrato** — aceita, rejeita ou bloqueia com base em evidências estruturadas, não em impressões.
+3. **O roteamento de recuperação é feito automaticamente** — o trabalho bloqueado ou rejeitado é roteado para o resolvedor correto, com um motivo, tipo de recuperação e artefato necessário.
-## Estado de implantação na organização
+## Despacho com consciência de orçamento
-O estado de implantação em toda a organização (fila, decisões, registros de auditoria, pacotes de bloqueio por repositório) reside em um repositório privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositório é o produto; aquele repositório é o estado operacional.
+O Role OS pode consultar um **analista de orçamento de tokens** local para cada etapa de despacho e anexar uma previsão de gastos consultiva ao manifesto — opcional (`ROLEOS_BUDGET_CONSULT`), consultiva (nunca bloqueia um despacho) e com fallback para uma linha de base determinística. Desativado por padrão; a previsão é local e gratuita. Consulte o [manual](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
+## Estado de implantação em toda a organização
+O estado de implantação em toda a organização (fila, decisões, registros de auditoria, pacotes de bloqueio por repositório) está armazenado em um repositório privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositório é o produto; aquele repositório é o estado operacional.
 ## Memória e continuidade
-O Role OS não possui nem duplica a camada de memória. Onde a memória do projeto Claude existe, ela é o sistema de continuidade canônico — os fatos do repositório, decisões, lacunas abertas e histórico de tratamento residem lá.
+O Role OS não possui nem duplica a camada de memória. Onde a memória do projeto Claude existe, ela é o sistema de continuidade canônico — fatos do repositório, decisões, tarefas pendentes e histórico de tratamento estão armazenados lá.
-O Role OS se integra com a memória do projeto Claude. Ele não a substitui.
+O Role OS se integra à memória do projeto Claude. Ele não a substitui.
-## Tratamento completo e verificação de envio
+## Tratamento completo e verificação de lançamento
-O tratamento completo é um protocolo canônico de 7 fases definido na memória do projeto Claude (`memory/full-treatment.md`). O Role OS direciona e revisa os tratamentos usando contratos de função, transferências e portas de revisão — ele não redefine o protocolo.
+O tratamento completo é um protocolo canônico de 7 fases definido na memória do projeto Claude (`memory/full-treatment.md`). O Role OS roteia e revisa os tratamentos usando contratos de função, transferências e portões de críticos — ele não redefine o protocolo.
-A **verificação de envio (Shipcheck)** é a porta de qualidade de 31 itens que é executada antes do tratamento completo. As portas rígidas A a D devem ser aprovadas antes que qualquer tratamento comece. Referência canônica: `memory/shipcheck.md`.
+**Verificação de lançamento** é o portão de qualidade de 31 itens que é executado antes do tratamento completo. Os portões rígidos A-D devem ser aprovados antes que qualquer tratamento comece. Referência canônica: `memory/shipcheck.md`.
-Ordem: Verificação de envio primeiro, depois tratamento completo. Não há v1.0.0 sem a aprovação das portas rígidas.
+Ordem: Verificação de lançamento primeiro, depois tratamento completo. Sem v1.0.0 sem a aprovação dos portões rígidos.
-## 32 funções em 8 pacotes
+## 61 funções em 10 pacotes
 | Pacote | Funções |
 |------|-------|
-| **Core** (3) | Coordenador, Estrategista de Produto, Avaliador Crítico |
-| **Engineering** (7) | Desenvolvedor Front-end, Engenheiro Back-end, Engenheiro de Testes, Engenheiro de Refatoração, Engenheiro de Desempenho, Auditor de Dependências, Avaliador de Segurança |
-| **Design** (2) | Designer de Interface, Guardião da Marca |
-| **Marketing** (1) | Redator para Lançamento |
-| **Treatment** (7) | Pesquisador de Repositórios, Tradutor de Repositórios, Arquiteto de Documentação, Curador de Metadados, Auditor de Cobertura, Verificador de Implantação, Engenheiro de Lançamento |
-| **Product** (3) | Sintetizador de feedback, Priorizador de roteiro, Redator de especificações. |
-| **Research** (4) | Pesquisador de Experiência do Usuário, Analista da Concorrência, Pesquisador de Tendências, Sintetizador de Entrevistas com Usuários |
+| **Core** (3) | Orquestrador, Estrategista de Produto, Revisor Crítico |
+| **Engineering** (7) | Desenvolvedor Frontend, Engenheiro Backend, Engenheiro de Testes, Engenheiro de Refatoração, Engenheiro de Desempenho, Auditor de Dependências, Revisor de Segurança |
+| **Design** (2) | Designer de UI, Guardião da Marca |
+| **Marketing** (1) | Redator de Conteúdo de Lançamento |
+| **Treatment** (7) | Pesquisador de Repositório, Tradutor de Repositório, Arquiteto de Documentação, Curador de Metadados, Auditor de Cobertura, Verificador de Implantação, Engenheiro de Lançamento |
+| **Product** (3) | Sintetizador de Feedback, Priorizador de Roadmap, Redator de Especificações |
+| **Research** (4) | Pesquisador de UX, Analista Competitivo, Pesquisador de Tendências, Sintetizador de Entrevistas com Usuários |
 | **Growth** (4) | Estrategista de Lançamento, Estrategista de Conteúdo, Gerente de Comunidade, Líder de Triagem de Suporte |
+| **Deep Audit** (4) | Auditor de Componentes, Auditor de Verdade de Testes, Auditor de Interface, Sintetizador de Auditoria |
+| **Swarm** (7) | Coordenador de Grupo, Agente Backend do Grupo, Agente de Ponte do Grupo, Agente de Testes do Grupo, Agente de Infraestrutura do Grupo, Agente Frontend do Grupo, Sintetizador do Grupo |
-Cada função tem um contrato completo: missão, quando usar, quando não usar, entradas esperadas, saídas necessárias, padrão de qualidade e gatilhos de escalonamento. Cada função pode ser direcionada — `roleos route` pode recomendar qualquer uma delas com base no conteúdo do pacote.
+Cada função tem um contrato completo: missão, quando usar, quando não usar, entradas esperadas, saídas necessárias, padrão de qualidade e gatilhos de escalonamento. Cada função pode ser roteada — `roleos route` pode recomendar qualquer uma delas com base no conteúdo do pacote.
-## Como começar
+## Guia rápido
 ```bash
 npx role-os init
@@ -133,6 +139,19 @@ roleos complete artifact.md    # Complete with artifact
 roleos explain                 # Show full state
 roleos report                  # Completion report
+# Deep audit:
+roleos audit manifest --generate   # Create audit-manifest.json
+roleos audit                       # Start component-level deep audit
+roleos audit status                # Check audit progress
+roleos audit verify                # Verify manifest and outputs
+# Dogfood swarm:
+roleos swarm manifest --generate   # Auto-detect domains from repo structure
+roleos swarm                       # Start multi-pass convergence swarm
+roleos swarm status                # Check swarm progress by stage
+roleos swarm findings              # List findings by severity
+roleos swarm approve               # Approve feature gate
 # Or go manual:
 roleos start "fix the crash"   # Entry decision only (no run)
 roleos packet new feature
@@ -146,55 +165,55 @@ roleos packs list
 ## Quando não usar o Role OS
-- Correções simples, erros de digitação ou bugs óbvios
-- Pesquisa exploratória sem saída definida
+- Correções pontuais, erros de digitação ou bugs óbvios
+- Pesquisa exploratória sem resultados definidos
 - Trabalho que cabe na cabeça de uma pessoa em 5 minutos
-- Correções emergenciais que precisam ser lançadas antes que a cadeia de revisão seja concluída
-- Projetos onde a velocidade é mais importante que a estrutura
+- Correções de emergência que precisam ser implementadas antes que a cadeia de revisão seja concluída
+- Projetos em que você prioriza a velocidade em vez da estrutura
 ## Evidências
-O Role OS foi comprovado em três modelos de teste em dois repositórios estruturalmente diferentes:
+O Role OS foi comprovado em três cenários de teste em dois repositórios estruturalmente diferentes:
-**Teste 001 — Trabalho de funcionalidade** (Tela da Equipe, Star Freight)
-- Cadeia de 7 funções, 45 cenários de teste, 0 conflito de funções.
-- Preveniu a contaminação de um ancestral bifurcado, detectou invenções inline e revelou bloqueios reais.
+**Teste 001 — Trabalho em funcionalidades** (Tela da equipe, Star Freight)
+- Cadeia de 7 funções, 45 cenários de teste, 0 conflitos de funções
+- Evitou a contaminação de um ancestral de fork, detectou invenções em tempo real e identificou obstáculos reais
-**Teste 002 — Trabalho de integração** (Conexão do Estado da Campanha, Star Freight)
-- Cadeia de 5 funções, resolveu a junção arquitetural sem mentiras de fallback.
-- Testes anti-fallback provaram que o caminho ativo é real, não um espaço reservado.
+**Teste 002 — Trabalho de integração** (Configuração do CampaignState, Star Freight)
+- Cadeia de 5 funções, resolveu uma lacuna arquitetônica sem recorrer a soluções alternativas
+- Testes anti-fallback comprovaram que o caminho ativo é real, não apenas um espaço reservado
-**Teste 003 — Trabalho de identidade** (Remoção de contaminação, Star Freight)
-- Cadeia de 6 funções, 51 cenários de teste, incluindo defesa durável contra contaminação do CI.
-- Corrigiu a derivação de ficção herdada sem reverter para uma grande reformulação.
+**Teste 003 — Trabalho de identidade** (Purga de contaminação, Star Freight)
+- Cadeia de 6 funções, 51 cenários de teste, incluindo defesa duradoura contra contaminação no CI
+- Corrigiu desvios de informações herdadas sem levar a um redesenho amplo
-**Teste de portabilidade** (Consistência da persona, sensibilidade aos sensores)
-- Mesma estrutura básica, diferentes idiomas/domínios/pilhas de tecnologias.
-- Adaptado apenas com mudanças de contexto — sem modificações no contrato principal.
+**Teste de portabilidade** (Consistência da persona, humor do sensor)
+- Mesma estrutura, linguagem/domínio/pilha diferentes
+- Adotado com apenas alterações de contexto — sem modificações no contrato principal
-**Tratamento Completo FT-001** (portlight-desktop)
-- Tratamento completo em 7 fases, com funções do Pacote de Tratamento
-- Verificação de lançamento comprovada, sem colisões de funções
+**Tratamento completo FT-001** (portlight-desktop)
+- Tratamento em 7 fases com funções do Treatment Pack
+- Comprovação do controle de Shipcheck, zero conflitos de funções
-**Tratamento Completo FT-002** (studioflow)
-- Mesmo pacote de tratamento, repositório estruturalmente diferente (ambiente de criação vs. jogo)
-- Pacote de tratamento portátil — nenhuma modificação no contrato é necessária
+**Tratamento completo FT-002** (studioflow)
+- Mesmo Treatment Pack, repositório estruturalmente diferente (espaço de trabalho criativo versus jogo)
+- Treatment Pack portátil — nenhuma modificação no contrato necessária
-**Sessão de brainstorming de alta qualidade** (tópico do mercado de servidores MCP)
-- Cadeia de 9 papéis, 4 analistas em paralelo, análise cruzada + gráfico de refutação de disputas.
-- 4 desafios propostos, 3 alegações refinadas, 1 não resolvida — pressão saudável, sem impasse.
-- Mais de 16 links de rastreamento dos artefatos gerados até os átomos da camada de verdade.
-- Cadeia de custódia completa comprovada: verdade → átomos → disputa → síntese → expandir → julgar → renderizar → rastrear.
+**Sessão de brainstorming** (tópico do mercado do servidor MCP)
+- Cadeia de 9 funções, 4 analistas em paralelo, análise cruzada + refutação do gráfico de disputa
+- 4 desafios lançados, 3 alegações restritas, 1 não resolvida — pressão saudável, não um impasse
+- Mais de 16 links de rastreamento de artefatos renderizados de volta aos átomos da camada de verdade
+- Cadeia completa de custódia comprovada: verdade → átomos → disputa → síntese → expansão → julgamento → renderização → rastreamento
-## Propriedades essenciais
+## Propriedades principais
-Estas são inegociáveis. Se uma alteração enfraquecer qualquer uma delas, rejeite-a.
+Estas são inegociáveis. Se uma alteração enfraquecer alguma delas, rejeite-a.
-- Os limites de função são mantidos.
-- A revisão é rigorosa.
-- A escalação permanece transparente.
-- Os pacotes permanecem testáveis.
-- A portabilidade requer adaptação ao contexto, não alterações profundas na estrutura.
+- Os limites das funções são mantidos
+- A revisão é rigorosa
+- A escalada permanece honesta
+- Os pacotes permanecem testáveis
+- A portabilidade requer adaptação de contexto, não cirurgia no núcleo
 ## Estrutura do projeto
@@ -206,18 +225,23 @@ role-os/
     entry-cmd.mjs              ← `roleos start` CLI command
     run.mjs                    ← Persistent run engine: create → step → pause → resume → report
     run-cmd.mjs                ← `roleos run/resume/next/explain/complete/fail` + interventions
-    mission.mjs                ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
+    mission.mjs                ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
     mission-run.mjs            ← Mission runner: create → step → complete → report
     mission-cmd.mjs            ← `roleos mission` CLI commands
-    route.mjs                  ← 31-role routing + dynamic chain builder
-    packs.mjs                  ← 7 calibrated team packs + auto-selection
+    audit-cmd.mjs              ← `roleos audit` — deep audit entry point with manifest generation
+    swarm-cmd.mjs              ← `roleos swarm` — dogfood swarm entry point with domain detection
+    swarm/                     ← Domain detection, build gate, evidence persistence bridge
+    route.mjs                  ← 61-role routing + dynamic chain builder
+    packs.mjs                  ← 10 calibrated team packs + auto-selection
     conflicts.mjs              ← 4-pass conflict detection
     escalation.mjs             ← Auto-routing for blocked/rejected/split
     evidence.mjs               ← Structured evidence + role-aware requirements
     dispatch.mjs               ← Runtime dispatch manifests for multi-claude
-    artifacts.mjs              ← 30 per-role artifact contracts + 7 pack handoffs
+    tool-profiles.mjs          ← Per-role tool sandboxing (shared by dispatch + trial)
+    state-machine.mjs          ← Canonical step/run transition maps
+    artifacts.mjs              ← Per-role artifact contracts + pack handoffs
     decompose.mjs              ← Composite task detection + splitting
-    composite.mjs              ← Dependency-ordered execution + recovery
+    composite.mjs              ← Dependency-ordered execution + recovery + cycle detection
     replan.mjs                 ← Mid-run adaptive replanning
     calibration.mjs            ← Outcome recording + weight tuning
     hooks.mjs                  ← 5 lifecycle hooks for runtime enforcement
@@ -225,56 +249,60 @@ role-os/
     brainstorm.mjs             ← Evidence modes, request validation, finding/synthesis/judge schemas
     brainstorm-roles.mjs       ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
     brainstorm-render.mjs      ← Two-layer rendering: lexical bans, render schemas, debate transcript
-  test/                        ← 894 tests across 30 test files
+  test/                        ← 1150 tests across 37 test files
   starter-pack/                ← Drop-in role contracts, policies, schemas, workflows
 ```
 ## Segurança
-O sistema "Role OS" opera **apenas localmente**. Ele copia modelos em formato Markdown e escreve arquivos de pacotes/resultados no diretório `.claude/` do seu repositório. Ele não acessa a rede, não lida com informações confidenciais e não coleta dados de telemetria. Não há operações perigosas — todas as operações de escrita de arquivos usam a opção "skip-if-exists" por padrão. Consulte o arquivo [SECURITY.md](SECURITY.md) para a política completa.
+O Role OS opera **apenas localmente**. Ele copia modelos Markdown e grava arquivos de pacote/veredicto no diretório `.claude/` do seu repositório. Ele não acessa a rede, manipula segredos ou coleta dados de telemetria. Nenhuma operação perigosa — todas as gravações de arquivos usam o recurso "ignorar se já existir" por padrão. Consulte [SECURITY.md](SECURITY.md) para obter a política completa.
 ## O sistema operacional
-| Camada. | O que ele faz | Status |
+| Camada | O que ele faz | Status |
 |-------|-------------|--------|
-| **Routing** | Avalia todas as 31 funções com base no conteúdo do pacote, explica as recomendações, avalia a confiança. | ✓ Implementado. |
-| **Chain builder** | Monta cadeias ordenadas por fase a partir de funções classificadas, com viés para o tipo de pacote, mas não bloqueadas por modelos. | ✓ Implementado. |
-| **Conflict detection** | Validação em 4 etapas: conflitos graves, sequência, redundância, lacunas de cobertura. Sugestões de correção. | ✓ Implementado. |
-| **Escalation** | Direciona automaticamente o trabalho bloqueado/rejeitado/dividido para o resolvedor correto, com motivo + artefato necessário. | ✓ Implementado. |
-| **Evidence** | Evidências estruturadas em decisões, específicas para cada função. Verificações de suficiência. 12 tipos de evidência. | ✓ Implementado. |
-| **Dispatch** | Gera manifestos de execução para multi-claude. Perfis de ferramentas por função, prompts do sistema, orçamentos. | ✓ Implementado. |
-| **Trials** | Conjunto completo comprovado: 30/30 tarefas de sucesso + 5/5 testes negativos. 7 testes de pacote concluídos. | ✓ Completo. |
-| **Team Packs** | 7 pacotes calibrados com seleção automática, proteções contra incompatibilidades e fallback de direcionamento livre. | ✓ Implementado. |
-| **Outcome calibration** | Registra os resultados da execução, ajusta os pesos dos pacotes/funções com base nos resultados e ajusta os limites de confiança. | ✓ Implementado. |
-| **Mixed-task decomposition** | Detecta trabalhos compostos, divide em pacotes filhos, atribui pacotes, preserva dependências. | ✓ Implementado. |
-| **Composite execution** | Executa pacotes filhos na ordem de dependência, com passagem de artefatos, recuperação de ramificação e síntese. | ✓ Implementado. |
-| **Adaptive replanning** | Alterações de escopo, descobertas ou novos requisitos durante a execução atualizam o plano sem reinicialização. | ✓ Implementado. |
-| **Session spine** | `roleos init claude` cria os arquivos CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica as conexões. Os cartões de roteamento comprovam o engajamento. | ✓ Implementado. |
-| **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicação de políticas: lembretes de roteamento, controle de acesso a ferramentas, injeção de papéis de subagente, auditoria de conclusão. | ✓ Implementado. |
-| **Artifact spine** | 20 contratos de artefatos por papel. 7 contratos de transferência de pacotes. Validação estrutural. Verificações de integridade da cadeia. Os papéis subsequentes nunca adivinham o que receberam. | ✓ Implementado. |
-| **Mission library** | 6 missões nomeadas (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch). Cada uma define pacote, cadeia de papéis, fluxo de artefatos, ramificações de escalonamento, definição honesta e parcial. Todas as 6 foram testadas e aprimoradas. | ✓ Implementado. |
-| **Mission runner** | Criação de execuções, acompanhamento passo a passo com estado rastreado, conclusão/falha com relatórios precisos. Propagação de etapas bloqueadas, avisos de escalonamento fora da cadeia, reabertura da última etapa. | ✓ Implementado. |
-| **Unified entry** | `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Sistema de fallback com pontuações de confiança, alternativas e detecção composta. | ✓ Implementado. |
-| **Persistent runs** | `roleos run` cria execuções com backup no disco. Comandos: `resume` (retomar), `next` (próximo), `explain` (explicar), `complete` (concluir), `fail` (falha). Intervenções: redirecionar, escalar, tentar novamente, bloquear, reabrir. Orientações específicas para cada etapa. Medição de atrito. | ✓ Implementado. |
-| **Brainstorm** | Arquitetura de duas camadas: verdade (esquemas nativos do papel, átomos de procedência, gráfico de disputa de análise cruzada) + renderização (5 vozes distintas, restrições lexicais, transcrição do debate). Os links de rastreamento comprovam que cada alegação renderizada corresponde a um átomo de verdade. Sessão de brainstorming de alta qualidade: 894 testes. | ✓ Implementado. |
-## 6 missões
+| **Routing** | Avalia todas as 61 funções em relação ao conteúdo do pacote, explica as recomendações e avalia a confiança | ✓ Implementado |
+| **Chain builder** | Monta cadeias ordenadas por fase a partir de funções avaliadas, com viés para o tipo de pacote, mas não restrito a modelos | ✓ Implementado |
+| **Conflict detection** | Validação em 4 etapas: conflitos graves, sequência, redundância, lacunas de cobertura. Sugestões de correção. | ✓ Implementado |
+| **Escalation** | Roteia automaticamente o trabalho bloqueado/rejeitado/dividido para o resolvedor correto, com razão + artefato necessário | ✓ Implementado |
+| **Evidence** | Evidências estruturadas e conscientes da função nos veredictos. Verificações de suficiência. 12 tipos de evidências. | ✓ Implementado |
+| **Dispatch** | Gera manifestos de execução para multi-claude. Perfis de ferramentas por função, prompts do sistema, orçamentos. | ✓ Implementado |
+| **Trials** | Conjunto completo comprovado: 30/30 tarefas de ouro + 5/5 testes negativos. 7 testes de pacote concluídos. | ✓ Completo |
+| **Team Packs** | 10 pacotes calibrados com seleção automática, proteções contra incompatibilidade e fallback de roteamento livre. | ✓ Implementado |
+| **Outcome calibration** | Registra os resultados da execução, ajusta os pesos do pacote/função com base nos resultados e ajusta os limites de confiança. | ✓ Implementado |
+| **Mixed-task decomposition** | Detecta trabalho composto, divide em pacotes filhos, atribui pacotes e preserva as dependências. | ✓ Implementado |
+| **Composite execution** | Executa os pacotes filhos em ordem de dependência, com passagem de artefatos, recuperação de ramificações e síntese. | ✓ Implementado |
+| **Adaptive replanning** | Alterações de escopo, descobertas ou novos requisitos durante a execução atualizam o plano sem reiniciar. | ✓ Implementado |
+| **Session spine** | `roleos init claude` cria os arquivos CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica a configuração. Os cartões de roteamento comprovam o envolvimento. | ✓ Implementado |
+| **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicação consultiva: lembretes do cartão de roteamento, controle de escrita de ferramentas, injeção de função de subagente, auditoria de conclusão. | ✓ Implementado |
+| **Artifact spine** | Contratos de artefato por função. Contratos de transferência de pacote. Validação estrutural. Verificações de integridade da cadeia. As funções a jusante nunca adivinham o que receberam. | ✓ Implementado |
+| **Mission library** | 9 missões nomeadas (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm, deep-audit, dogfood-swarm). Cada uma declara o pacote, a cadeia de funções, o fluxo de artefatos, as ramificações de escalada e a definição honesta-parcial. | ✓ Implementado |
+| **Mission runner** | Crie execuções, percorra-as com estado rastreado, complete/falhe com relatórios honestos. Propagação de etapas bloqueadas, avisos de escalada fora da cadeia, reabertura da última etapa. | ✓ Implementado |
+| **Unified entry** | `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Escada de fallback com pontuações de confiança, alternativas e detecção de composição. | ✓ Implementado |
+| **Persistent runs** | `roleos run` cria execuções armazenadas em disco. `resume`, `next`, `explain`, `complete`, `fail`. Intervenções: reroute, escalate, retry, block, reopen. Orientação local da etapa. Medição de atrito. | ✓ Implementado |
+| **Brainstorm** | Arquitetura de duas camadas: verdade (esquemas nativos da função, átomos de proveniência, gráfico de disputa de análise cruzada) + renderização (5 vozes distintas, proibições lexicais, transcrição do debate). Os links de rastreamento comprovam que cada afirmação renderizada se relaciona com um átomo de verdade. Execução de ouro comprovada. | ✓ Implementado |
+| **Deep Audit** | Auditoria de repositório com base no manifesto: decompor o repositório em componentes, enviar N auditores + M auditores de testes de verificação + K auditores de interface a partir do grafo de dependências, sintetizar em um veredicto classificado e plano de ação. O envio dinâmico é dimensionado de acordo com o tamanho do repositório (fórmula 2N + K + 3). Nativo do executor, com validação de artefatos em cada etapa. | ✓ Implementado |
+| **Dogfood Swarm** | Convergência de múltiplas etapas: três estágios de saúde (bug/segurança → proativo → humanização) e, em seguida, etapa de recursos. Propriedade exclusiva de arquivos, barreiras de construção após cada iteração, pontos de verificação do usuário. A detecção automática de domínio gera manifestos. Ponte de evidências para os laboratórios de testes internos. | ✓ Implementado |
+## 9 missões
 | Missão | Pacote | Funções | Quando usar |
 |---------|------|-------|-------------|
-| `feature-ship` | Funcionalidade (feature) | 5 | Entrega completa da funcionalidade: escopo → especificação → implementação → teste → revisão |
-| `bugfix` | Correção de bug (bugfix) | 4 | Diagnosticar a causa raiz, corrigir, testar, verificar |
-| `treatment` | Tratamento | 4 | Verificação + polimento + documentação + verificação CI + revisão |
-| `docs-release` | Documentação | 2 | Escrever/atualizar documentação, notas de lançamento |
-| `security-hardening` | Segurança | 4 | Modelo de ameaças, auditoria, correção de vulnerabilidades, re-auditoria, verificação |
-| `research-launch` | Pesquisa | 4 | Formular a pergunta, pesquisar, documentar os resultados, decidir |
-| `brainstorm` | brainstorming | 9 | Investigação estruturada com múltiplas perspectivas, com desacordo rastreável e veredicto. |
-Cada missão inclui definições honestas e parciais — quando o trabalho é interrompido, o sistema documenta o que foi concluído e o que resta, em vez de apresentar uma conclusão falsa.
+| `feature-ship` | Recurso | 5 | Entrega completa de recursos: escopo → especificação → implementação → teste → revisão |
+| `bugfix` | Correção de bug | 4 | Diagnosticar a causa raiz, corrigir, testar, verificar |
+| `treatment` | Tratamento | 4 | Verificação de envio + refinamento + documentação + verificação de CI + revisão |
+| `docs-release` | Documentação | 2 | Escrever/atualizar a documentação, notas de lançamento |
+| `security-hardening` | Segurança | 4 | Modelo de ameaças, auditoria, correção de vulnerabilidades, reauditoria, verificação |
+| `research-launch` | Pesquisa | 4 | Formular a pergunta, pesquisar, documentar as descobertas, decidir |
+| `brainstorm` | Brainstorming | 9 | Análise estruturada e multiperspectiva com discordância e veredicto rastreáveis |
+| `deep-audit` | Auditoria aprofundada | 5 (escalas) | Auditoria de repositório com base no manifesto — o número de trabalhadores é dimensionado de acordo com o grafo do repositório por meio de envio dinâmico |
+| `dogfood-swarm` | Enxame | 8 (escalas) | Convergência de múltiplas etapas: saúde-a → saúde-b → saúde-c → recurso → síntese final |
+Cada missão inclui definições honestas e parciais — quando o trabalho é interrompido, o sistema documenta o que foi concluído e o que resta, em vez de fingir que tudo foi concluído.
 ### Missão de brainstorming
-Não é "brainstorming de IA". A missão de brainstorming é **papéis especializados sob a lei, com desacordo rastreável e resultados que comprovam o veredicto.**
+Não é um "brainstorming de IA". A missão de brainstorming é composta por **funções especializadas sob a lei, com discordância e resultados que levam a um veredicto rastreáveis.**
 ```bash
 roleos run "explore product directions for a developer tool discovery platform"
@@ -282,33 +310,61 @@ roleos run "explore product directions for a developer tool discovery platform"
 #   Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
 ```
-**O que a diferencia:**
+**O que a torna diferente:**
+- **Camada 1 (verdade):** Quatro analistas emitem esquemas nativos de função (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — não é uma prosa compartilhada. Cada função tem pontos cegos aplicados: frases proibidas, tipos de afirmações proibidas, partições de entrada filtradas. Os átomos carregam a proveniência. Um grafo de questionamento cruzado direcionado produz desafios direcionados. Os analistas originais defendem, restringem ou retiram suas afirmações sob pressão.
+- **Camada 2 (renderização):** Cinco vozes humanas distintas (Memorando de Limites, Notas de Campo, Esboço do Sistema, Resumo de Afirmações, Transcrição do Questionamento Cruzado) com proibições lexicais que impedem a convergência das vozes. A síntese consome a verdade, nunca a prosa renderizada. Ambas as camadas estão sempre disponíveis.
+- **Cadeia de custódia:** Cada frase renderizada rastreia até um átomo da camada de verdade. As direções de síntese citam átomos. Os alvos do questionamento cruzado são IDs de afirmações reais. O grafo de disputa é o produto, não a prosa.
+**Comprovado:** Execução de referência v0.4 — cadeia de custódia completa verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para a cadeia completa de artefatos.
+### Missão de auditoria aprofundada
+Não é uma varredura superficial. A missão de auditoria aprofundada **decompõe um repositório em componentes delimitados e envia auditores especializados em uma escala determinada pelo próprio grafo de dependências do repositório.**
-- **Camada 1 (verdade):** Quatro analistas emitem esquemas nativos do papel (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — não é prosa compartilhada. Cada papel tem restrições para evitar pontos cegos: frases proibidas, tipos de alegações proibidas, partições de entrada filtradas. Os átomos carregam informações de procedência. Um gráfico de análise cruzada direcionada gera desafios específicos. Os analistas originais defendem, refinam ou retiram suas alegações sob pressão.
+```bash
+roleos run "deep audit this repo" --manifest=audit-manifest.json
+# → MISSION: Deep Audit (Manifest-Scaled)
+#   Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
+```
+**O que a torna diferente:**
+- **Envio dinâmico:** o número de trabalhadores não é fixo. Um repositório de 10 componentes com 5 clusters de limites produz 28 etapas (2 × 10 + 5 + 3). Um repositório de 3 componentes produz 12. A fórmula de dimensionamento é `2N + K + 3`, onde N = componentes, K = limites.
+- **Pacotes com base no manifesto:** um arquivo `audit-manifest.json` define os componentes (com caminhos de arquivo, contagem de linhas, descrições) e os limites (de/para com descrições da interface). Cada auditor recebe apenas seu pacote.
+- **Quatro arquétipos de função:** Auditor de Componentes (verdade do código por módulo), Auditor de Testes de Verificação (testes que comprovam vs. testes que existem), Auditor de Interface (limites de integração do grafo de dependências), Sintetizador de Auditoria (veredicto classificado + plano de ação de todos os pacotes).
+- **Validação de artefatos em cada etapa:** `validateArtifact()` é acionado em cada etapa de conclusão em ambos os caminhos de execução. Os resultados são anexados aos objetos de etapa. O sistema sabe se cada artefato atendeu ao seu contrato.
+- **Honestidade parcial:** quando o orçamento ou o escopo impedem a conclusão, as descobertas por componente são individualmente válidas. O sistema sintetiza a partir do que foi concluído, nunca finge cobertura total.
+**Comprovado:** Execução nativa do executor — 18 testes em um manifesto real, ciclo de vida completo verificado, incluindo reabertura de escalonamento e falha parcial. A fórmula de dimensionamento foi verificada para manifestos de 3/6/10/15 componentes.
+### Missão de enxame de testes internos
+Não é uma varredura única. A missão de enxame de testes internos **executa um protocolo de convergência de múltiplas etapas que move um repositório de "funciona" para "pronto para produção" por meio de três estágios de saúde e entrega iterativa de recursos.**
+```bash
+roleos swarm
+# → MISSION: Dogfood Swarm (Multi-Pass Convergence)
+#   Stages: Health-A → Health-B → Health-C → Feature → Final
+#   Domain agents: 3-5 parallel per wave (exclusive file ownership)
+```
-- **Camada 2 (renderização):** Cinco vozes humanas distintas (Boundary Memo, Field Notes, System Sketch, Claim Brief, Cross-Exam Transcript) com restrições lexicais para evitar a convergência das vozes. A síntese consome a verdade, nunca a prosa renderizada. Ambas as camadas estão sempre disponíveis.
+**O que a torna diferente:**
-- **Cadeia de custódia:** Cada frase renderizada rastreia até um átomo da camada de verdade. As instruções de síntese citam os átomos. Os alvos da análise cruzada são IDs de alegações reais. O gráfico de disputa é o produto, não a prosa.
+- **Sistema de validação em três etapas** — A etapa A corrige erros e problemas de segurança (ciclo até que não haja mais erros CRÍTICOS ou de ALTA prioridade). A etapa B aplica medidas de segurança proativas (os utilizadores avaliam os resultados). A etapa C torna o código mais intuitivo — mensagens de erro que ajudam os utilizadores, feedback de reconexão, estados de carregamento, acessibilidade. Cada etapa é uma lente distinta, não a mesma análise repetida.
+- **Propriedade exclusiva de ficheiros** — cada agente de domínio possui ficheiros específicos através do ficheiro `swarm-manifest.json`. Nenhum dos agentes edita o mesmo ficheiro. Não há conflitos de fusão. Não há sobrecarga de coordenação.
+- **Controles de construção** — a análise de código, a verificação de tipos e os testes devem ser aprovados após cada ciclo. O sistema deteta automaticamente o sistema de construção (Node, Rust, Python, Go) e executa os comandos corretos.
+- **Pontos de verificação do utilizador** — a etapa de validação (Health-B) e a etapa de funcionalidades exigem a aprovação explícita do utilizador antes da execução. O sistema apresenta os resultados e o utilizador decide o que construir.
+- **Convergência iterativa** — as etapas são executadas em ciclos, juntamente com os ciclos de validação, até que as condições de saída sejam cumpridas ou o número máximo de iterações seja atingido. Cada ciclo reavalia tudo desde o início para detetar regressões introduzidas por correções anteriores.
+- **Deteção automática de domínio** — o comando `roleos swarm manifest --generate` deteta o tipo de repositório (CLI, web, desktop, MCP, monorepo) e gera atribuições de domínio não sobrepostas.
-**Comprovado:** versão 0.4 da sessão de brainstorming de alta qualidade — 894 testes, cadeia de custódia completa verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para a cadeia completa de artefatos.
+**Comprovado:** claude-collaborate (2026-03-28) — 35→129 testes, 106 problemas de validação corrigidos, versão v1.1.0 lançada. Protocolo v2.0 com 9 fases.
 ## Status
-- v0.1–v0.4: Fundação — testes, adoção, pacote de tratamento, pacote inicial.
-- v1.0.0: 32 funções, CLI completa, tratamento comprovado, portabilidade multi-repositório.
-- v1.0.2: Bloqueio do sistema operacional para funções (correções de inicialização, `init --force`).
-- v1.1.0: 31 funções, roteamento completo, detecção de conflitos, escalonamento, evidências, despacho, 7 pacotes de equipe comprovados. 35 testes de execução. 212 testes.
-- v1.2.0: Pacotes calibrados promovidos a entrada padrão. Seleção automática, detecção de incompatibilidades, sugestão alternativa, fallback de roteamento livre. 246 testes.
-- v1.3.0: Calibração de resultados, decomposição de tarefas mistas, execução composta, replanejamento adaptativo. 317 testes.
-- v1.4.0: Espinha dorsal da sessão — `roleos init claude`, `roleos doctor`, cartões de rota, comandos `/roleos-route + /roleos-review + /roleos-status`. 335 testes.
-- v1.5.0: Espinha dorsal de hooks — 5 hooks de ciclo de vida para aplicação em tempo de execução. 358 testes.
-- v1.6.0: Espinha dorsal de artefatos — 20 contratos de artefatos por função, 7 contratos de transferência de pacotes, validação estrutural. 385 testes.
-- v1.7.0: Prova de conclusão — tarefas reais executadas em toda a pilha. CLI `roleos artifacts`. Escalabilidade honesta para correções estruturais. 398 testes.
-- v1.8.0: Biblioteca de missões (Fase S) — 6 missões nomeadas, motor de execução, relatórios de conclusão. Reforçado com 6 execuções de teste reais. 481 testes.
-- v1.9.0: Caminho de entrada unificado (Fase T) — `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Escada de fallback, detecção composta, testes de comparação de caminho de entrada. 527 testes.
-- **v2.0.0**: Otimização da experiência do usuário (Fase U) — `roleos run` cria execuções persistentes com backup em disco. Retomar, próximo, explicar, completar, falhar. Intervenções: redirecionar, escalar, tentar novamente, bloquear, reabrir. Orientação passo a passo em cada etapa. Medição de atrito. 6 testes de atrito. 613 testes.
-- **v2.0.1**: Auditoria do manual, documentação para iniciantes, correções na contagem de testes. 617 testes.
-- **v2.1.0**: Missão de brainstorming (v0.4) — funções especializadas sob a lei, desacordo rastreável, saída com valor de decisão. Arquitetura de duas camadas (verdade + renderização), matriz de permissão de interrogatório, grafo de disputas, prova de execução ideal. 7 missões, 50 funções, 8 pacotes. 894 testes.
+Estável e em produção. Consulte o [REGISTO DE ALTERAÇÕES](CHANGELOG.md) para obter o histórico completo das versões e o que mudou em cada lançamento.
 ## Licença
@@ -316,4 +372,4 @@ MIT
 ---
-Desenvolvido por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
+Criado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>