role-os 2.7.0 → 2.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/README.pt-BR.md CHANGED
@@ -13,20 +13,20 @@
13
13
  <a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
14
14
  </p>
15
15
 
16
- Um sistema operacional multi-Claude que aloca, direciona, valida e executa tarefas por meio de 31 contratos de funções especializadas. Cria pacotes de tarefas, monta a equipe certa com base em correspondência de funções, detecta problemas antes da execução, direciona automaticamente a recuperação quando o trabalho é bloqueado ou rejeitado e exige evidências estruturadas em cada decisão.
16
+ Um sistema operacional multi-Claude que aloca, direciona, valida e executa tarefas por meio de 61 contratos de função especializados. Cria pacotes de tarefas, monta a equipe ideal com base na correspondência de funções, detecta falhas antes da execução, roteia automaticamente a recuperação quando uma tarefa é interrompida ou rejeitada e exige evidências estruturadas em cada verificação. Inclui despacho dinâmico para missões de grande escala — um repositório de 10 componentes se transforma automaticamente em 28 etapas de auditoria, em vez de 6.
17
17
 
18
18
  ## O que ele faz
19
19
 
20
- Role OS é a maneira profissional de usar o multi-Claude. Ele evita as falhas específicas que os fluxos de trabalho de IA genéricos produzem:
20
+ Role OS é a maneira profissional de usar o multi-Claude. Ele previne as falhas específicas que os fluxos de trabalho genéricos de IA produzem:
21
21
 
22
- - **Desvio (Drift)** — as funções permanecem em seu domínio. O produto não é redesenhado. A interface não redefine o escopo. O backend não inventa a direção do produto.
23
- - **Conclusão falsa** — a definição de "concluído" é concreta. O trabalho que esconde lacunas, ignora a verificação ou resolve um problema diferente é rejeitado.
24
- - **Contaminação** — projetos bifurcados ou herdados carregam resíduos de identidade. O Role OS detecta e rejeita desvios entre projetos em termos, visuais e modelos mentais.
25
- - **Progresso baseado em impressões** — cada transferência é estruturada. Cada veredicto está vinculado a evidências. "Parece pronto" não é um estado válido.
22
+ - **Desvio** — as funções permanecem dentro de seus limites. O produto não é redesenhado. O frontend não redefine o escopo. O backend não inventa a direção do produto.
23
+ - **Conclusão falsa** — a definição de "concluído" é concreta. O trabalho que oculta lacunas, ignora a verificação ou resolve um problema diferente é rejeitado.
24
+ - **Contaminação** — projetos ramificados ou herdados carregam resíduos de identidade. O Role OS detecta e rejeita o desvio entre projetos na terminologia, elementos visuais e modelos mentais.
25
+ - **Progresso baseado em "vibes"** — cada transferência é estruturada. Cada verificação está vinculada a evidências. "Parece concluído" não é um estado válido.
26
26
 
27
27
  ## Como funciona
28
28
 
29
- Descreva sua tarefa. O Role OS decide automaticamente o nível de orquestração adequado.
29
+ Descreva sua tarefa. O Role OS decide automaticamente o nível ideal de orquestração.
30
30
 
31
31
  ```bash
32
32
  roleos start "fix the crash in save handler"
@@ -42,15 +42,15 @@ roleos start "something completely novel"
42
42
  # Hint: Create a packet and run `roleos route` for role-level routing
43
43
  ```
44
44
 
45
- **A hierarquia de fallback:**
45
+ **A escada de fallback:**
46
46
 
47
- 1. **Missão:** quando a tarefa corresponde a um fluxo de trabalho recorrente comprovado (correção de bugs, tratamento, lançamento de recursos, documentação, segurança, pesquisa). Cadeia de funções conhecida, fluxo de artefatos, ramificações de escalonamento e definições parciais claras.
48
- 2. **Pacote:** quando a tarefa é uma família conhecida, mas não se encaixa em um formato de missão completo. 7 pacotes de equipe calibrados com seleção automática e proteções contra incompatibilidades.
49
- 3. **Direcionamento livre:** quando a tarefa é nova, mista ou incerta. Avalia todas as 31 funções com base no conteúdo do pacote e monta uma cadeia dinâmica.
47
+ 1. **Missão** quando a tarefa corresponde a um fluxo de trabalho recorrente comprovado (correção de bug, tratamento, lançamento de recurso, documentação, segurança, pesquisa, brainstorming, auditoria aprofundada, teste em grupo). Cadeia de funções conhecida, fluxo de artefatos, ramificações de escalonamento e definições honestas e parciais.
48
+ 2. **Pacote** quando a tarefa pertence a uma família conhecida, mas não tem a forma completa de uma missão. 10 pacotes de equipe calibrados com seleção automática e proteções contra incompatibilidades.
49
+ 3. **Roteamento livre** quando a tarefa é nova, mista ou incerta. Avalia todas as 61 funções em relação ao conteúdo do pacote e monta uma cadeia dinâmica.
50
50
 
51
- O sistema nunca força o trabalho a passar pela camada de abstração incorreta. Ele explica por que escolheu cada nível e oferece alternativas.
51
+ O sistema nunca força o trabalho por meio da abstração errada. Ele explica por que escolheu cada nível e oferece alternativas.
52
52
 
53
- **Um comando para iniciar a execução:**
53
+ **Um único comando para iniciar a execução:**
54
54
 
55
55
  ```bash
56
56
  roleos run "fix the crash in save handler"
@@ -77,48 +77,54 @@ roleos block 2 "waiting for API spec"
77
77
  roleos reopen 0 "found issue in review"
78
78
  ```
79
79
 
80
- As execuções são persistidas no disco (em `.claude/runs/`), permitindo que as sessões interrompidas sejam retomadas sem problemas. Cada etapa inclui orientações para o operador: o que produzir, as seções necessárias e as condições de parada.
80
+ As execuções são persistidas em disco (`.claude/runs/`), para que as sessões interrompidas sejam retomadas de forma limpa. Cada etapa inclui orientação para o operador: o que produzir, seções necessárias e condições de parada.
81
81
 
82
- **Depois de direcionado:**
82
+ **Após o roteamento:**
83
83
 
84
- 1. **Cada função produz uma transferência:** saída estruturada com itens de evidência que reduzem a ambiguidade para a próxima função.
85
- 2. **O revisor avalia em relação ao contrato:** aceita, rejeita ou bloqueia com base em evidências estruturadas, e não em impressões.
86
- 3. **A recuperação é direcionada automaticamente:** o trabalho bloqueado ou rejeitado é direcionado ao resolvedor correto, com um motivo, tipo de recuperação e artefato necessário.
84
+ 1. **Cada função produz uma transferência** saída estruturada com itens de evidência que reduzem a ambiguidade para a próxima função.
85
+ 2. **O crítico avalia em relação ao contrato** aceita, rejeita ou bloqueia com base em evidências estruturadas, não em impressões.
86
+ 3. **O roteamento de recuperação é feito automaticamente** o trabalho bloqueado ou rejeitado é roteado para o resolvedor correto, com um motivo, tipo de recuperação e artefato necessário.
87
87
 
88
- ## Estado de implantação na organização
88
+ ## Despacho com consciência de orçamento
89
89
 
90
- O estado de implantação em toda a organização (fila, decisões, registros de auditoria, pacotes de bloqueio por repositório) reside em um repositório privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositório é o produto; aquele repositório é o estado operacional.
90
+ O Role OS pode consultar um **analista de orçamento de tokens** local para cada etapa de despacho e anexar uma previsão de gastos consultiva ao manifesto — opcional (`ROLEOS_BUDGET_CONSULT`), consultiva (nunca bloqueia um despacho) e com fallback para uma linha de base determinística. Desativado por padrão; a previsão é local e gratuita. Consulte o [manual](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
91
+
92
+ ## Estado de implantação em toda a organização
93
+
94
+ O estado de implantação em toda a organização (fila, decisões, registros de auditoria, pacotes de bloqueio por repositório) está armazenado em um repositório privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositório é o produto; aquele repositório é o estado operacional.
91
95
 
92
96
  ## Memória e continuidade
93
97
 
94
- O Role OS não possui nem duplica a camada de memória. Onde a memória do projeto Claude existe, ela é o sistema de continuidade canônico — os fatos do repositório, decisões, lacunas abertas e histórico de tratamento residem lá.
98
+ O Role OS não possui nem duplica a camada de memória. Onde a memória do projeto Claude existe, ela é o sistema de continuidade canônico — fatos do repositório, decisões, tarefas pendentes e histórico de tratamento estão armazenados lá.
95
99
 
96
- O Role OS se integra com a memória do projeto Claude. Ele não a substitui.
100
+ O Role OS se integra à memória do projeto Claude. Ele não a substitui.
97
101
 
98
- ## Tratamento completo e verificação de envio
102
+ ## Tratamento completo e verificação de lançamento
99
103
 
100
- O tratamento completo é um protocolo canônico de 7 fases definido na memória do projeto Claude (`memory/full-treatment.md`). O Role OS direciona e revisa os tratamentos usando contratos de função, transferências e portas de revisão — ele não redefine o protocolo.
104
+ O tratamento completo é um protocolo canônico de 7 fases definido na memória do projeto Claude (`memory/full-treatment.md`). O Role OS roteia e revisa os tratamentos usando contratos de função, transferências e portões de críticos — ele não redefine o protocolo.
101
105
 
102
- A **verificação de envio (Shipcheck)** é a porta de qualidade de 31 itens que é executada antes do tratamento completo. As portas rígidas A a D devem ser aprovadas antes que qualquer tratamento comece. Referência canônica: `memory/shipcheck.md`.
106
+ **Verificação de lançamento** é o portão de qualidade de 31 itens que é executado antes do tratamento completo. Os portões rígidos A-D devem ser aprovados antes que qualquer tratamento comece. Referência canônica: `memory/shipcheck.md`.
103
107
 
104
- Ordem: Verificação de envio primeiro, depois tratamento completo. Não v1.0.0 sem a aprovação das portas rígidas.
108
+ Ordem: Verificação de lançamento primeiro, depois tratamento completo. Sem v1.0.0 sem a aprovação dos portões rígidos.
105
109
 
106
- ## 32 funções em 8 pacotes
110
+ ## 61 funções em 10 pacotes
107
111
 
108
112
  | Pacote | Funções |
109
113
  |------|-------|
110
- | **Core** (3) | Coordenador, Estrategista de Produto, Avaliador Crítico |
111
- | **Engineering** (7) | Desenvolvedor Front-end, Engenheiro Back-end, Engenheiro de Testes, Engenheiro de Refatoração, Engenheiro de Desempenho, Auditor de Dependências, Avaliador de Segurança |
112
- | **Design** (2) | Designer de Interface, Guardião da Marca |
113
- | **Marketing** (1) | Redator para Lançamento |
114
- | **Treatment** (7) | Pesquisador de Repositórios, Tradutor de Repositórios, Arquiteto de Documentação, Curador de Metadados, Auditor de Cobertura, Verificador de Implantação, Engenheiro de Lançamento |
115
- | **Product** (3) | Sintetizador de feedback, Priorizador de roteiro, Redator de especificações. |
116
- | **Research** (4) | Pesquisador de Experiência do Usuário, Analista da Concorrência, Pesquisador de Tendências, Sintetizador de Entrevistas com Usuários |
114
+ | **Core** (3) | Orquestrador, Estrategista de Produto, Revisor Crítico |
115
+ | **Engineering** (7) | Desenvolvedor Frontend, Engenheiro Backend, Engenheiro de Testes, Engenheiro de Refatoração, Engenheiro de Desempenho, Auditor de Dependências, Revisor de Segurança |
116
+ | **Design** (2) | Designer de UI, Guardião da Marca |
117
+ | **Marketing** (1) | Redator de Conteúdo de Lançamento |
118
+ | **Treatment** (7) | Pesquisador de Repositório, Tradutor de Repositório, Arquiteto de Documentação, Curador de Metadados, Auditor de Cobertura, Verificador de Implantação, Engenheiro de Lançamento |
119
+ | **Product** (3) | Sintetizador de Feedback, Priorizador de Roadmap, Redator de Especificações |
120
+ | **Research** (4) | Pesquisador de UX, Analista Competitivo, Pesquisador de Tendências, Sintetizador de Entrevistas com Usuários |
117
121
  | **Growth** (4) | Estrategista de Lançamento, Estrategista de Conteúdo, Gerente de Comunidade, Líder de Triagem de Suporte |
122
+ | **Deep Audit** (4) | Auditor de Componentes, Auditor de Verdade de Testes, Auditor de Interface, Sintetizador de Auditoria |
123
+ | **Swarm** (7) | Coordenador de Grupo, Agente Backend do Grupo, Agente de Ponte do Grupo, Agente de Testes do Grupo, Agente de Infraestrutura do Grupo, Agente Frontend do Grupo, Sintetizador do Grupo |
118
124
 
119
- Cada função tem um contrato completo: missão, quando usar, quando não usar, entradas esperadas, saídas necessárias, padrão de qualidade e gatilhos de escalonamento. Cada função pode ser direcionada — `roleos route` pode recomendar qualquer uma delas com base no conteúdo do pacote.
125
+ Cada função tem um contrato completo: missão, quando usar, quando não usar, entradas esperadas, saídas necessárias, padrão de qualidade e gatilhos de escalonamento. Cada função pode ser roteada — `roleos route` pode recomendar qualquer uma delas com base no conteúdo do pacote.
120
126
 
121
- ## Como começar
127
+ ## Guia rápido
122
128
 
123
129
  ```bash
124
130
  npx role-os init
@@ -133,6 +139,19 @@ roleos complete artifact.md # Complete with artifact
133
139
  roleos explain # Show full state
134
140
  roleos report # Completion report
135
141
 
142
+ # Deep audit:
143
+ roleos audit manifest --generate # Create audit-manifest.json
144
+ roleos audit # Start component-level deep audit
145
+ roleos audit status # Check audit progress
146
+ roleos audit verify # Verify manifest and outputs
147
+
148
+ # Dogfood swarm:
149
+ roleos swarm manifest --generate # Auto-detect domains from repo structure
150
+ roleos swarm # Start multi-pass convergence swarm
151
+ roleos swarm status # Check swarm progress by stage
152
+ roleos swarm findings # List findings by severity
153
+ roleos swarm approve # Approve feature gate
154
+
136
155
  # Or go manual:
137
156
  roleos start "fix the crash" # Entry decision only (no run)
138
157
  roleos packet new feature
@@ -146,55 +165,55 @@ roleos packs list
146
165
 
147
166
  ## Quando não usar o Role OS
148
167
 
149
- - Correções simples, erros de digitação ou bugs óbvios
150
- - Pesquisa exploratória sem saída definida
168
+ - Correções pontuais, erros de digitação ou bugs óbvios
169
+ - Pesquisa exploratória sem resultados definidos
151
170
  - Trabalho que cabe na cabeça de uma pessoa em 5 minutos
152
- - Correções emergenciais que precisam ser lançadas antes que a cadeia de revisão seja concluída
153
- - Projetos onde a velocidade é mais importante que a estrutura
171
+ - Correções de emergência que precisam ser implementadas antes que a cadeia de revisão seja concluída
172
+ - Projetos em que você prioriza a velocidade em vez da estrutura
154
173
 
155
174
  ## Evidências
156
175
 
157
- O Role OS foi comprovado em três modelos de teste em dois repositórios estruturalmente diferentes:
176
+ O Role OS foi comprovado em três cenários de teste em dois repositórios estruturalmente diferentes:
158
177
 
159
- **Teste 001 — Trabalho de funcionalidade** (Tela da Equipe, Star Freight)
160
- - Cadeia de 7 funções, 45 cenários de teste, 0 conflito de funções.
161
- - Preveniu a contaminação de um ancestral bifurcado, detectou invenções inline e revelou bloqueios reais.
178
+ **Teste 001 — Trabalho em funcionalidades** (Tela da equipe, Star Freight)
179
+ - Cadeia de 7 funções, 45 cenários de teste, 0 conflitos de funções
180
+ - Evitou a contaminação de um ancestral de fork, detectou invenções em tempo real e identificou obstáculos reais
162
181
 
163
- **Teste 002 — Trabalho de integração** (Conexão do Estado da Campanha, Star Freight)
164
- - Cadeia de 5 funções, resolveu a junção arquitetural sem mentiras de fallback.
165
- - Testes anti-fallback provaram que o caminho ativo é real, não um espaço reservado.
182
+ **Teste 002 — Trabalho de integração** (Configuração do CampaignState, Star Freight)
183
+ - Cadeia de 5 funções, resolveu uma lacuna arquitetônica sem recorrer a soluções alternativas
184
+ - Testes anti-fallback comprovaram que o caminho ativo é real, não apenas um espaço reservado
166
185
 
167
- **Teste 003 — Trabalho de identidade** (Remoção de contaminação, Star Freight)
168
- - Cadeia de 6 funções, 51 cenários de teste, incluindo defesa durável contra contaminação do CI.
169
- - Corrigiu a derivação de ficção herdada sem reverter para uma grande reformulação.
186
+ **Teste 003 — Trabalho de identidade** (Purga de contaminação, Star Freight)
187
+ - Cadeia de 6 funções, 51 cenários de teste, incluindo defesa duradoura contra contaminação no CI
188
+ - Corrigiu desvios de informações herdadas sem levar a um redesenho amplo
170
189
 
171
- **Teste de portabilidade** (Consistência da persona, sensibilidade aos sensores)
172
- - Mesma estrutura básica, diferentes idiomas/domínios/pilhas de tecnologias.
173
- - Adaptado apenas com mudanças de contexto — sem modificações no contrato principal.
190
+ **Teste de portabilidade** (Consistência da persona, humor do sensor)
191
+ - Mesma estrutura, linguagem/domínio/pilha diferentes
192
+ - Adotado com apenas alterações de contexto — sem modificações no contrato principal
174
193
 
175
- **Tratamento Completo FT-001** (portlight-desktop)
176
- - Tratamento completo em 7 fases, com funções do Pacote de Tratamento
177
- - Verificação de lançamento comprovada, sem colisões de funções
194
+ **Tratamento completo FT-001** (portlight-desktop)
195
+ - Tratamento em 7 fases com funções do Treatment Pack
196
+ - Comprovação do controle de Shipcheck, zero conflitos de funções
178
197
 
179
- **Tratamento Completo FT-002** (studioflow)
180
- - Mesmo pacote de tratamento, repositório estruturalmente diferente (ambiente de criação vs. jogo)
181
- - Pacote de tratamento portátil — nenhuma modificação no contrato é necessária
198
+ **Tratamento completo FT-002** (studioflow)
199
+ - Mesmo Treatment Pack, repositório estruturalmente diferente (espaço de trabalho criativo versus jogo)
200
+ - Treatment Pack portátil — nenhuma modificação no contrato necessária
182
201
 
183
- **Sessão de brainstorming de alta qualidade** (tópico do mercado de servidores MCP)
184
- - Cadeia de 9 papéis, 4 analistas em paralelo, análise cruzada + gráfico de refutação de disputas.
185
- - 4 desafios propostos, 3 alegações refinadas, 1 não resolvida — pressão saudável, sem impasse.
186
- - Mais de 16 links de rastreamento dos artefatos gerados até os átomos da camada de verdade.
187
- - Cadeia de custódia completa comprovada: verdade → átomos → disputa → síntese → expandirjulgarrenderizarrastrear.
202
+ **Sessão de brainstorming** (tópico do mercado do servidor MCP)
203
+ - Cadeia de 9 funções, 4 analistas em paralelo, análise cruzada + refutação do gráfico de disputa
204
+ - 4 desafios lançados, 3 alegações restritas, 1 não resolvida — pressão saudável, não um impasse
205
+ - Mais de 16 links de rastreamento de artefatos renderizados de volta aos átomos da camada de verdade
206
+ - Cadeia completa de custódia comprovada: verdade → átomos → disputa → síntese → expansãojulgamentorenderizaçãorastreamento
188
207
 
189
- ## Propriedades essenciais
208
+ ## Propriedades principais
190
209
 
191
- Estas são inegociáveis. Se uma alteração enfraquecer qualquer uma delas, rejeite-a.
210
+ Estas são inegociáveis. Se uma alteração enfraquecer alguma delas, rejeite-a.
192
211
 
193
- - Os limites de função são mantidos.
194
- - A revisão é rigorosa.
195
- - A escalação permanece transparente.
196
- - Os pacotes permanecem testáveis.
197
- - A portabilidade requer adaptação ao contexto, não alterações profundas na estrutura.
212
+ - Os limites das funções são mantidos
213
+ - A revisão é rigorosa
214
+ - A escalada permanece honesta
215
+ - Os pacotes permanecem testáveis
216
+ - A portabilidade requer adaptação de contexto, não cirurgia no núcleo
198
217
 
199
218
  ## Estrutura do projeto
200
219
 
@@ -206,18 +225,23 @@ role-os/
206
225
  entry-cmd.mjs ← `roleos start` CLI command
207
226
  run.mjs ← Persistent run engine: create → step → pause → resume → report
208
227
  run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
209
- mission.mjs ← 7 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm)
228
+ mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
210
229
  mission-run.mjs ← Mission runner: create → step → complete → report
211
230
  mission-cmd.mjs ← `roleos mission` CLI commands
212
- route.mjs 31-role routing + dynamic chain builder
213
- packs.mjs 7 calibrated team packs + auto-selection
231
+ audit-cmd.mjs `roleos audit` deep audit entry point with manifest generation
232
+ swarm-cmd.mjs `roleos swarm` dogfood swarm entry point with domain detection
233
+ swarm/ ← Domain detection, build gate, evidence persistence bridge
234
+ route.mjs ← 61-role routing + dynamic chain builder
235
+ packs.mjs ← 10 calibrated team packs + auto-selection
214
236
  conflicts.mjs ← 4-pass conflict detection
215
237
  escalation.mjs ← Auto-routing for blocked/rejected/split
216
238
  evidence.mjs ← Structured evidence + role-aware requirements
217
239
  dispatch.mjs ← Runtime dispatch manifests for multi-claude
218
- artifacts.mjs 30 per-role artifact contracts + 7 pack handoffs
240
+ tool-profiles.mjs Per-role tool sandboxing (shared by dispatch + trial)
241
+ state-machine.mjs ← Canonical step/run transition maps
242
+ artifacts.mjs ← Per-role artifact contracts + pack handoffs
219
243
  decompose.mjs ← Composite task detection + splitting
220
- composite.mjs ← Dependency-ordered execution + recovery
244
+ composite.mjs ← Dependency-ordered execution + recovery + cycle detection
221
245
  replan.mjs ← Mid-run adaptive replanning
222
246
  calibration.mjs ← Outcome recording + weight tuning
223
247
  hooks.mjs ← 5 lifecycle hooks for runtime enforcement
@@ -225,56 +249,60 @@ role-os/
225
249
  brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
226
250
  brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
227
251
  brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
228
- test/ ← 894 tests across 30 test files
252
+ test/ ← 1150 tests across 37 test files
229
253
  starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
230
254
  ```
231
255
 
232
256
  ## Segurança
233
257
 
234
- O sistema "Role OS" opera **apenas localmente**. Ele copia modelos em formato Markdown e escreve arquivos de pacotes/resultados no diretório `.claude/` do seu repositório. Ele não acessa a rede, não lida com informações confidenciais e não coleta dados de telemetria. Não operações perigosas — todas as operações de escrita de arquivos usam a opção "skip-if-exists" por padrão. Consulte o arquivo [SECURITY.md](SECURITY.md) para a política completa.
258
+ O Role OS opera **apenas localmente**. Ele copia modelos Markdown e grava arquivos de pacote/veredicto no diretório `.claude/` do seu repositório. Ele não acessa a rede, manipula segredos ou coleta dados de telemetria. Nenhuma operação perigosa — todas as gravações de arquivos usam o recurso "ignorar se já existir" por padrão. Consulte [SECURITY.md](SECURITY.md) para obter a política completa.
235
259
 
236
260
  ## O sistema operacional
237
261
 
238
- | Camada. | O que ele faz | Status |
262
+ | Camada | O que ele faz | Status |
239
263
  |-------|-------------|--------|
240
- | **Routing** | Avalia todas as 31 funções com base no conteúdo do pacote, explica as recomendações, avalia a confiança. | ✓ Implementado. |
241
- | **Chain builder** | Monta cadeias ordenadas por fase a partir de funções classificadas, com viés para o tipo de pacote, mas não bloqueadas por modelos. | ✓ Implementado. |
242
- | **Conflict detection** | Validação em 4 etapas: conflitos graves, sequência, redundância, lacunas de cobertura. Sugestões de correção. | ✓ Implementado. |
243
- | **Escalation** | Direciona automaticamente o trabalho bloqueado/rejeitado/dividido para o resolvedor correto, com motivo + artefato necessário. | ✓ Implementado. |
244
- | **Evidence** | Evidências estruturadas em decisões, específicas para cada função. Verificações de suficiência. 12 tipos de evidência. | ✓ Implementado. |
245
- | **Dispatch** | Gera manifestos de execução para multi-claude. Perfis de ferramentas por função, prompts do sistema, orçamentos. | ✓ Implementado. |
246
- | **Trials** | Conjunto completo comprovado: 30/30 tarefas de sucesso + 5/5 testes negativos. 7 testes de pacote concluídos. | ✓ Completo. |
247
- | **Team Packs** | 7 pacotes calibrados com seleção automática, proteções contra incompatibilidades e fallback de direcionamento livre. | ✓ Implementado. |
248
- | **Outcome calibration** | Registra os resultados da execução, ajusta os pesos dos pacotes/funções com base nos resultados e ajusta os limites de confiança. | ✓ Implementado. |
249
- | **Mixed-task decomposition** | Detecta trabalhos compostos, divide em pacotes filhos, atribui pacotes, preserva dependências. | ✓ Implementado. |
250
- | **Composite execution** | Executa pacotes filhos na ordem de dependência, com passagem de artefatos, recuperação de ramificação e síntese. | ✓ Implementado. |
251
- | **Adaptive replanning** | Alterações de escopo, descobertas ou novos requisitos durante a execução atualizam o plano sem reinicialização. | ✓ Implementado. |
252
- | **Session spine** | `roleos init claude` cria os arquivos CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica as conexões. Os cartões de roteamento comprovam o engajamento. | ✓ Implementado. |
253
- | **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicação de políticas: lembretes de roteamento, controle de acesso a ferramentas, injeção de papéis de subagente, auditoria de conclusão. | ✓ Implementado. |
254
- | **Artifact spine** | 20 contratos de artefatos por papel. 7 contratos de transferência de pacotes. Validação estrutural. Verificações de integridade da cadeia. Os papéis subsequentes nunca adivinham o que receberam. | ✓ Implementado. |
255
- | **Mission library** | 6 missões nomeadas (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch). Cada uma define pacote, cadeia de papéis, fluxo de artefatos, ramificações de escalonamento, definição honesta e parcial. Todas as 6 foram testadas e aprimoradas. | ✓ Implementado. |
256
- | **Mission runner** | Criação de execuções, acompanhamento passo a passo com estado rastreado, conclusão/falha com relatórios precisos. Propagação de etapas bloqueadas, avisos de escalonamento fora da cadeia, reabertura da última etapa. | ✓ Implementado. |
257
- | **Unified entry** | `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Sistema de fallback com pontuações de confiança, alternativas e detecção composta. | ✓ Implementado. |
258
- | **Persistent runs** | `roleos run` cria execuções com backup no disco. Comandos: `resume` (retomar), `next` (próximo), `explain` (explicar), `complete` (concluir), `fail` (falha). Intervenções: redirecionar, escalar, tentar novamente, bloquear, reabrir. Orientações específicas para cada etapa. Medição de atrito. | ✓ Implementado. |
259
- | **Brainstorm** | Arquitetura de duas camadas: verdade (esquemas nativos do papel, átomos de procedência, gráfico de disputa de análise cruzada) + renderização (5 vozes distintas, restrições lexicais, transcrição do debate). Os links de rastreamento comprovam que cada alegação renderizada corresponde a um átomo de verdade. Sessão de brainstorming de alta qualidade: 894 testes. | ✓ Implementado. |
260
-
261
- ## 6 missões
264
+ | **Routing** | Avalia todas as 61 funções em relação ao conteúdo do pacote, explica as recomendações e avalia a confiança | ✓ Implementado |
265
+ | **Chain builder** | Monta cadeias ordenadas por fase a partir de funções avaliadas, com viés para o tipo de pacote, mas não restrito a modelos | ✓ Implementado |
266
+ | **Conflict detection** | Validação em 4 etapas: conflitos graves, sequência, redundância, lacunas de cobertura. Sugestões de correção. | ✓ Implementado |
267
+ | **Escalation** | Roteia automaticamente o trabalho bloqueado/rejeitado/dividido para o resolvedor correto, com razão + artefato necessário | ✓ Implementado |
268
+ | **Evidence** | Evidências estruturadas e conscientes da função nos veredictos. Verificações de suficiência. 12 tipos de evidências. | ✓ Implementado |
269
+ | **Dispatch** | Gera manifestos de execução para multi-claude. Perfis de ferramentas por função, prompts do sistema, orçamentos. | ✓ Implementado |
270
+ | **Trials** | Conjunto completo comprovado: 30/30 tarefas de ouro + 5/5 testes negativos. 7 testes de pacote concluídos. | ✓ Completo |
271
+ | **Team Packs** | 10 pacotes calibrados com seleção automática, proteções contra incompatibilidade e fallback de roteamento livre. | ✓ Implementado |
272
+ | **Outcome calibration** | Registra os resultados da execução, ajusta os pesos do pacote/função com base nos resultados e ajusta os limites de confiança. | ✓ Implementado |
273
+ | **Mixed-task decomposition** | Detecta trabalho composto, divide em pacotes filhos, atribui pacotes e preserva as dependências. | ✓ Implementado |
274
+ | **Composite execution** | Executa os pacotes filhos em ordem de dependência, com passagem de artefatos, recuperação de ramificações e síntese. | ✓ Implementado |
275
+ | **Adaptive replanning** | Alterações de escopo, descobertas ou novos requisitos durante a execução atualizam o plano sem reiniciar. | ✓ Implementado |
276
+ | **Session spine** | `roleos init claude` cria os arquivos CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica a configuração. Os cartões de roteamento comprovam o envolvimento. | ✓ Implementado |
277
+ | **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicação consultiva: lembretes do cartão de roteamento, controle de escrita de ferramentas, injeção de função de subagente, auditoria de conclusão. | ✓ Implementado |
278
+ | **Artifact spine** | Contratos de artefato por função. Contratos de transferência de pacote. Validação estrutural. Verificações de integridade da cadeia. As funções a jusante nunca adivinham o que receberam. | ✓ Implementado |
279
+ | **Mission library** | 9 missões nomeadas (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm, deep-audit, dogfood-swarm). Cada uma declara o pacote, a cadeia de funções, o fluxo de artefatos, as ramificações de escalada e a definição honesta-parcial. | ✓ Implementado |
280
+ | **Mission runner** | Crie execuções, percorra-as com estado rastreado, complete/falhe com relatórios honestos. Propagação de etapas bloqueadas, avisos de escalada fora da cadeia, reabertura da última etapa. | ✓ Implementado |
281
+ | **Unified entry** | `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Escada de fallback com pontuações de confiança, alternativas e detecção de composição. | ✓ Implementado |
282
+ | **Persistent runs** | `roleos run` cria execuções armazenadas em disco. `resume`, `next`, `explain`, `complete`, `fail`. Intervenções: reroute, escalate, retry, block, reopen. Orientação local da etapa. Medição de atrito. | ✓ Implementado |
283
+ | **Brainstorm** | Arquitetura de duas camadas: verdade (esquemas nativos da função, átomos de proveniência, gráfico de disputa de análise cruzada) + renderização (5 vozes distintas, proibições lexicais, transcrição do debate). Os links de rastreamento comprovam que cada afirmação renderizada se relaciona com um átomo de verdade. Execução de ouro comprovada. | ✓ Implementado |
284
+ | **Deep Audit** | Auditoria de repositório com base no manifesto: decompor o repositório em componentes, enviar N auditores + M auditores de testes de verificação + K auditores de interface a partir do grafo de dependências, sintetizar em um veredicto classificado e plano de ação. O envio dinâmico é dimensionado de acordo com o tamanho do repositório (fórmula 2N + K + 3). Nativo do executor, com validação de artefatos em cada etapa. | ✓ Implementado |
285
+ | **Dogfood Swarm** | Convergência de múltiplas etapas: três estágios de saúde (bug/segurança → proativo → humanização) e, em seguida, etapa de recursos. Propriedade exclusiva de arquivos, barreiras de construção após cada iteração, pontos de verificação do usuário. A detecção automática de domínio gera manifestos. Ponte de evidências para os laboratórios de testes internos. | ✓ Implementado |
286
+
287
+ ## 9 missões
262
288
 
263
289
  | Missão | Pacote | Funções | Quando usar |
264
290
  |---------|------|-------|-------------|
265
- | `feature-ship` | Funcionalidade (feature) | 5 | Entrega completa da funcionalidade: escopo → especificação → implementação → teste → revisão |
266
- | `bugfix` | Correção de bug (bugfix) | 4 | Diagnosticar a causa raiz, corrigir, testar, verificar |
267
- | `treatment` | Tratamento | 4 | Verificação + polimento + documentação + verificação CI + revisão |
268
- | `docs-release` | Documentação | 2 | Escrever/atualizar documentação, notas de lançamento |
269
- | `security-hardening` | Segurança | 4 | Modelo de ameaças, auditoria, correção de vulnerabilidades, re-auditoria, verificação |
270
- | `research-launch` | Pesquisa | 4 | Formular a pergunta, pesquisar, documentar os resultados, decidir |
271
- | `brainstorm` | brainstorming | 9 | Investigação estruturada com múltiplas perspectivas, com desacordo rastreável e veredicto. |
272
-
273
- Cada missão inclui definições honestas e parciais quando o trabalho é interrompido, o sistema documenta o que foi concluído e o que resta, em vez de apresentar uma conclusão falsa.
291
+ | `feature-ship` | Recurso | 5 | Entrega completa de recursos: escopo → especificação → implementação → teste → revisão |
292
+ | `bugfix` | Correção de bug | 4 | Diagnosticar a causa raiz, corrigir, testar, verificar |
293
+ | `treatment` | Tratamento | 4 | Verificação de envio + refinamento + documentação + verificação de CI + revisão |
294
+ | `docs-release` | Documentação | 2 | Escrever/atualizar a documentação, notas de lançamento |
295
+ | `security-hardening` | Segurança | 4 | Modelo de ameaças, auditoria, correção de vulnerabilidades, reauditoria, verificação |
296
+ | `research-launch` | Pesquisa | 4 | Formular a pergunta, pesquisar, documentar as descobertas, decidir |
297
+ | `brainstorm` | Brainstorming | 9 | Análise estruturada e multiperspectiva com discordância e veredicto rastreáveis |
298
+ | `deep-audit` | Auditoria aprofundada | 5 (escalas) | Auditoria de repositório com base no manifesto — o número de trabalhadores é dimensionado de acordo com o grafo do repositório por meio de envio dinâmico |
299
+ | `dogfood-swarm` | Enxame | 8 (escalas) | Convergência de múltiplas etapas: saúde-a saúde-b saúde-c recurso síntese final |
300
+
301
+ Cada missão inclui definições honestas e parciais — quando o trabalho é interrompido, o sistema documenta o que foi concluído e o que resta, em vez de fingir que tudo foi concluído.
274
302
 
275
303
  ### Missão de brainstorming
276
304
 
277
- Não é "brainstorming de IA". A missão de brainstorming é **papéis especializados sob a lei, com desacordo rastreável e resultados que comprovam o veredicto.**
305
+ Não é um "brainstorming de IA". A missão de brainstorming é composta por **funções especializadas sob a lei, com discordância e resultados que levam a um veredicto rastreáveis.**
278
306
 
279
307
  ```bash
280
308
  roleos run "explore product directions for a developer tool discovery platform"
@@ -282,33 +310,61 @@ roleos run "explore product directions for a developer tool discovery platform"
282
310
  # Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
283
311
  ```
284
312
 
285
- **O que a diferencia:**
313
+ **O que a torna diferente:**
314
+
315
+ - **Camada 1 (verdade):** Quatro analistas emitem esquemas nativos de função (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — não é uma prosa compartilhada. Cada função tem pontos cegos aplicados: frases proibidas, tipos de afirmações proibidas, partições de entrada filtradas. Os átomos carregam a proveniência. Um grafo de questionamento cruzado direcionado produz desafios direcionados. Os analistas originais defendem, restringem ou retiram suas afirmações sob pressão.
316
+
317
+ - **Camada 2 (renderização):** Cinco vozes humanas distintas (Memorando de Limites, Notas de Campo, Esboço do Sistema, Resumo de Afirmações, Transcrição do Questionamento Cruzado) com proibições lexicais que impedem a convergência das vozes. A síntese consome a verdade, nunca a prosa renderizada. Ambas as camadas estão sempre disponíveis.
318
+
319
+ - **Cadeia de custódia:** Cada frase renderizada rastreia até um átomo da camada de verdade. As direções de síntese citam átomos. Os alvos do questionamento cruzado são IDs de afirmações reais. O grafo de disputa é o produto, não a prosa.
320
+
321
+ **Comprovado:** Execução de referência v0.4 — cadeia de custódia completa verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para a cadeia completa de artefatos.
322
+
323
+ ### Missão de auditoria aprofundada
324
+
325
+ Não é uma varredura superficial. A missão de auditoria aprofundada **decompõe um repositório em componentes delimitados e envia auditores especializados em uma escala determinada pelo próprio grafo de dependências do repositório.**
286
326
 
287
- - **Camada 1 (verdade):** Quatro analistas emitem esquemas nativos do papel (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — não é prosa compartilhada. Cada papel tem restrições para evitar pontos cegos: frases proibidas, tipos de alegações proibidas, partições de entrada filtradas. Os átomos carregam informações de procedência. Um gráfico de análise cruzada direcionada gera desafios específicos. Os analistas originais defendem, refinam ou retiram suas alegações sob pressão.
327
+ ```bash
328
+ roleos run "deep audit this repo" --manifest=audit-manifest.json
329
+ # → MISSION: Deep Audit (Manifest-Scaled)
330
+ # Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
331
+ ```
332
+
333
+ **O que a torna diferente:**
334
+
335
+ - **Envio dinâmico:** o número de trabalhadores não é fixo. Um repositório de 10 componentes com 5 clusters de limites produz 28 etapas (2 × 10 + 5 + 3). Um repositório de 3 componentes produz 12. A fórmula de dimensionamento é `2N + K + 3`, onde N = componentes, K = limites.
336
+ - **Pacotes com base no manifesto:** um arquivo `audit-manifest.json` define os componentes (com caminhos de arquivo, contagem de linhas, descrições) e os limites (de/para com descrições da interface). Cada auditor recebe apenas seu pacote.
337
+ - **Quatro arquétipos de função:** Auditor de Componentes (verdade do código por módulo), Auditor de Testes de Verificação (testes que comprovam vs. testes que existem), Auditor de Interface (limites de integração do grafo de dependências), Sintetizador de Auditoria (veredicto classificado + plano de ação de todos os pacotes).
338
+ - **Validação de artefatos em cada etapa:** `validateArtifact()` é acionado em cada etapa de conclusão em ambos os caminhos de execução. Os resultados são anexados aos objetos de etapa. O sistema sabe se cada artefato atendeu ao seu contrato.
339
+ - **Honestidade parcial:** quando o orçamento ou o escopo impedem a conclusão, as descobertas por componente são individualmente válidas. O sistema sintetiza a partir do que foi concluído, nunca finge cobertura total.
340
+
341
+ **Comprovado:** Execução nativa do executor — 18 testes em um manifesto real, ciclo de vida completo verificado, incluindo reabertura de escalonamento e falha parcial. A fórmula de dimensionamento foi verificada para manifestos de 3/6/10/15 componentes.
342
+
343
+ ### Missão de enxame de testes internos
344
+
345
+ Não é uma varredura única. A missão de enxame de testes internos **executa um protocolo de convergência de múltiplas etapas que move um repositório de "funciona" para "pronto para produção" por meio de três estágios de saúde e entrega iterativa de recursos.**
346
+
347
+ ```bash
348
+ roleos swarm
349
+ # → MISSION: Dogfood Swarm (Multi-Pass Convergence)
350
+ # Stages: Health-A → Health-B → Health-C → Feature → Final
351
+ # Domain agents: 3-5 parallel per wave (exclusive file ownership)
352
+ ```
288
353
 
289
- - **Camada 2 (renderização):** Cinco vozes humanas distintas (Boundary Memo, Field Notes, System Sketch, Claim Brief, Cross-Exam Transcript) com restrições lexicais para evitar a convergência das vozes. A síntese consome a verdade, nunca a prosa renderizada. Ambas as camadas estão sempre disponíveis.
354
+ **O que a torna diferente:**
290
355
 
291
- - **Cadeia de custódia:** Cada frase renderizada rastreia até um átomo da camada de verdade. As instruções de síntese citam os átomos. Os alvos da análise cruzada são IDs de alegações reais. O gráfico de disputa é o produto, não a prosa.
356
+ - **Sistema de validação em três etapas** A etapa A corrige erros e problemas de segurança (ciclo até que não haja mais erros CRÍTICOS ou de ALTA prioridade). A etapa B aplica medidas de segurança proativas (os utilizadores avaliam os resultados). A etapa C torna o código mais intuitivo — mensagens de erro que ajudam os utilizadores, feedback de reconexão, estados de carregamento, acessibilidade. Cada etapa é uma lente distinta, não a mesma análise repetida.
357
+ - **Propriedade exclusiva de ficheiros** — cada agente de domínio possui ficheiros específicos através do ficheiro `swarm-manifest.json`. Nenhum dos agentes edita o mesmo ficheiro. Não há conflitos de fusão. Não há sobrecarga de coordenação.
358
+ - **Controles de construção** — a análise de código, a verificação de tipos e os testes devem ser aprovados após cada ciclo. O sistema deteta automaticamente o sistema de construção (Node, Rust, Python, Go) e executa os comandos corretos.
359
+ - **Pontos de verificação do utilizador** — a etapa de validação (Health-B) e a etapa de funcionalidades exigem a aprovação explícita do utilizador antes da execução. O sistema apresenta os resultados e o utilizador decide o que construir.
360
+ - **Convergência iterativa** — as etapas são executadas em ciclos, juntamente com os ciclos de validação, até que as condições de saída sejam cumpridas ou o número máximo de iterações seja atingido. Cada ciclo reavalia tudo desde o início para detetar regressões introduzidas por correções anteriores.
361
+ - **Deteção automática de domínio** — o comando `roleos swarm manifest --generate` deteta o tipo de repositório (CLI, web, desktop, MCP, monorepo) e gera atribuições de domínio não sobrepostas.
292
362
 
293
- **Comprovado:** versão 0.4 da sessão de brainstorming de alta qualidade 894 testes, cadeia de custódia completa verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para a cadeia completa de artefatos.
363
+ **Comprovado:** claude-collaborate (2026-03-28)35→129 testes, 106 problemas de validação corrigidos, versão v1.1.0 lançada. Protocolo v2.0 com 9 fases.
294
364
 
295
365
  ## Status
296
366
 
297
- - v0.1–v0.4: Fundação testes, adoção, pacote de tratamento, pacote inicial.
298
- - v1.0.0: 32 funções, CLI completa, tratamento comprovado, portabilidade multi-repositório.
299
- - v1.0.2: Bloqueio do sistema operacional para funções (correções de inicialização, `init --force`).
300
- - v1.1.0: 31 funções, roteamento completo, detecção de conflitos, escalonamento, evidências, despacho, 7 pacotes de equipe comprovados. 35 testes de execução. 212 testes.
301
- - v1.2.0: Pacotes calibrados promovidos a entrada padrão. Seleção automática, detecção de incompatibilidades, sugestão alternativa, fallback de roteamento livre. 246 testes.
302
- - v1.3.0: Calibração de resultados, decomposição de tarefas mistas, execução composta, replanejamento adaptativo. 317 testes.
303
- - v1.4.0: Espinha dorsal da sessão — `roleos init claude`, `roleos doctor`, cartões de rota, comandos `/roleos-route + /roleos-review + /roleos-status`. 335 testes.
304
- - v1.5.0: Espinha dorsal de hooks — 5 hooks de ciclo de vida para aplicação em tempo de execução. 358 testes.
305
- - v1.6.0: Espinha dorsal de artefatos — 20 contratos de artefatos por função, 7 contratos de transferência de pacotes, validação estrutural. 385 testes.
306
- - v1.7.0: Prova de conclusão — tarefas reais executadas em toda a pilha. CLI `roleos artifacts`. Escalabilidade honesta para correções estruturais. 398 testes.
307
- - v1.8.0: Biblioteca de missões (Fase S) — 6 missões nomeadas, motor de execução, relatórios de conclusão. Reforçado com 6 execuções de teste reais. 481 testes.
308
- - v1.9.0: Caminho de entrada unificado (Fase T) — `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Escada de fallback, detecção composta, testes de comparação de caminho de entrada. 527 testes.
309
- - **v2.0.0**: Otimização da experiência do usuário (Fase U) — `roleos run` cria execuções persistentes com backup em disco. Retomar, próximo, explicar, completar, falhar. Intervenções: redirecionar, escalar, tentar novamente, bloquear, reabrir. Orientação passo a passo em cada etapa. Medição de atrito. 6 testes de atrito. 613 testes.
310
- - **v2.0.1**: Auditoria do manual, documentação para iniciantes, correções na contagem de testes. 617 testes.
311
- - **v2.1.0**: Missão de brainstorming (v0.4) — funções especializadas sob a lei, desacordo rastreável, saída com valor de decisão. Arquitetura de duas camadas (verdade + renderização), matriz de permissão de interrogatório, grafo de disputas, prova de execução ideal. 7 missões, 50 funções, 8 pacotes. 894 testes.
367
+ Estável e em produção. Consulte o [REGISTO DE ALTERAÇÕES](CHANGELOG.md) para obter o histórico completo das versões e o que mudou em cada lançamento.
312
368
 
313
369
  ## Licença
314
370
 
@@ -316,4 +372,4 @@ MIT
316
372
 
317
373
  ---
318
374
 
319
- Desenvolvido por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a
375
+ Criado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>