role-os 2.6.0 → 2.7.1
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/CHANGELOG.md +26 -0
- package/README.es.md +185 -129
- package/README.fr.md +193 -137
- package/README.hi.md +191 -135
- package/README.it.md +186 -130
- package/README.ja.md +191 -135
- package/README.md +6 -18
- package/README.pt-BR.md +188 -132
- package/README.zh.md +192 -139
- package/bin/roleos.mjs +10 -0
- package/package.json +1 -1
- package/src/specialist/budget-consult.mjs +120 -0
- package/src/specialist/client.mjs +131 -0
- package/src/specialist/dispatch.mjs +237 -0
- package/src/specialist/events.mjs +56 -0
- package/src/specialist/gate.mjs +202 -0
- package/src/specialist/registry.mjs +219 -0
- package/src/specialist/shadow.mjs +122 -0
- package/src/specialist/state.mjs +125 -0
- package/src/specialist-cmd.mjs +378 -0
- package/starter-pack/policy/specialist-tier.md +288 -0
- package/starter-pack/schemas/specialist.md +155 -0
package/README.pt-BR.md
CHANGED
|
@@ -13,20 +13,20 @@
|
|
|
13
13
|
<a href="https://mcp-tool-shop-org.github.io/role-os/"><img src="https://img.shields.io/badge/Landing_Page-live-brightgreen" alt="Landing Page"></a>
|
|
14
14
|
</p>
|
|
15
15
|
|
|
16
|
-
Um sistema operacional multi-Claude que aloca, direciona, valida e executa tarefas por meio de
|
|
16
|
+
Um sistema operacional multi-Claude que aloca, direciona, valida e executa tarefas por meio de 61 contratos de função especializados. Cria pacotes de tarefas, monta a equipe ideal com base na correspondência de funções, detecta falhas antes da execução, roteia automaticamente a recuperação quando uma tarefa é interrompida ou rejeitada e exige evidências estruturadas em cada verificação. Inclui despacho dinâmico para missões de grande escala — um repositório de 10 componentes se transforma automaticamente em 28 etapas de auditoria, em vez de 6.
|
|
17
17
|
|
|
18
18
|
## O que ele faz
|
|
19
19
|
|
|
20
|
-
Role OS é a maneira profissional de usar o multi-Claude. Ele
|
|
20
|
+
Role OS é a maneira profissional de usar o multi-Claude. Ele previne as falhas específicas que os fluxos de trabalho genéricos de IA produzem:
|
|
21
21
|
|
|
22
|
-
- **Desvio
|
|
23
|
-
- **Conclusão falsa** — a definição de "concluído" é concreta. O trabalho que
|
|
24
|
-
- **Contaminação** — projetos
|
|
25
|
-
- **Progresso baseado em
|
|
22
|
+
- **Desvio** — as funções permanecem dentro de seus limites. O produto não é redesenhado. O frontend não redefine o escopo. O backend não inventa a direção do produto.
|
|
23
|
+
- **Conclusão falsa** — a definição de "concluído" é concreta. O trabalho que oculta lacunas, ignora a verificação ou resolve um problema diferente é rejeitado.
|
|
24
|
+
- **Contaminação** — projetos ramificados ou herdados carregam resíduos de identidade. O Role OS detecta e rejeita o desvio entre projetos na terminologia, elementos visuais e modelos mentais.
|
|
25
|
+
- **Progresso baseado em "vibes"** — cada transferência é estruturada. Cada verificação está vinculada a evidências. "Parece concluído" não é um estado válido.
|
|
26
26
|
|
|
27
27
|
## Como funciona
|
|
28
28
|
|
|
29
|
-
Descreva sua tarefa. O Role OS decide automaticamente o nível de orquestração
|
|
29
|
+
Descreva sua tarefa. O Role OS decide automaticamente o nível ideal de orquestração.
|
|
30
30
|
|
|
31
31
|
```bash
|
|
32
32
|
roleos start "fix the crash in save handler"
|
|
@@ -42,15 +42,15 @@ roleos start "something completely novel"
|
|
|
42
42
|
# Hint: Create a packet and run `roleos route` for role-level routing
|
|
43
43
|
```
|
|
44
44
|
|
|
45
|
-
**A
|
|
45
|
+
**A escada de fallback:**
|
|
46
46
|
|
|
47
|
-
1. **Missão
|
|
48
|
-
2. **Pacote
|
|
49
|
-
3. **
|
|
47
|
+
1. **Missão** — quando a tarefa corresponde a um fluxo de trabalho recorrente comprovado (correção de bug, tratamento, lançamento de recurso, documentação, segurança, pesquisa, brainstorming, auditoria aprofundada, teste em grupo). Cadeia de funções conhecida, fluxo de artefatos, ramificações de escalonamento e definições honestas e parciais.
|
|
48
|
+
2. **Pacote** — quando a tarefa pertence a uma família conhecida, mas não tem a forma completa de uma missão. 10 pacotes de equipe calibrados com seleção automática e proteções contra incompatibilidades.
|
|
49
|
+
3. **Roteamento livre** — quando a tarefa é nova, mista ou incerta. Avalia todas as 61 funções em relação ao conteúdo do pacote e monta uma cadeia dinâmica.
|
|
50
50
|
|
|
51
|
-
O sistema nunca força o trabalho
|
|
51
|
+
O sistema nunca força o trabalho por meio da abstração errada. Ele explica por que escolheu cada nível e oferece alternativas.
|
|
52
52
|
|
|
53
|
-
**Um comando para iniciar a execução:**
|
|
53
|
+
**Um único comando para iniciar a execução:**
|
|
54
54
|
|
|
55
55
|
```bash
|
|
56
56
|
roleos run "fix the crash in save handler"
|
|
@@ -77,48 +77,54 @@ roleos block 2 "waiting for API spec"
|
|
|
77
77
|
roleos reopen 0 "found issue in review"
|
|
78
78
|
```
|
|
79
79
|
|
|
80
|
-
As execuções são persistidas
|
|
80
|
+
As execuções são persistidas em disco (`.claude/runs/`), para que as sessões interrompidas sejam retomadas de forma limpa. Cada etapa inclui orientação para o operador: o que produzir, seções necessárias e condições de parada.
|
|
81
81
|
|
|
82
|
-
**
|
|
82
|
+
**Após o roteamento:**
|
|
83
83
|
|
|
84
|
-
1. **Cada função produz uma transferência
|
|
85
|
-
2. **O
|
|
86
|
-
3. **
|
|
84
|
+
1. **Cada função produz uma transferência** — saída estruturada com itens de evidência que reduzem a ambiguidade para a próxima função.
|
|
85
|
+
2. **O crítico avalia em relação ao contrato** — aceita, rejeita ou bloqueia com base em evidências estruturadas, não em impressões.
|
|
86
|
+
3. **O roteamento de recuperação é feito automaticamente** — o trabalho bloqueado ou rejeitado é roteado para o resolvedor correto, com um motivo, tipo de recuperação e artefato necessário.
|
|
87
87
|
|
|
88
|
-
##
|
|
88
|
+
## Despacho com consciência de orçamento
|
|
89
89
|
|
|
90
|
-
O
|
|
90
|
+
O Role OS pode consultar um **analista de orçamento de tokens** local para cada etapa de despacho e anexar uma previsão de gastos consultiva ao manifesto — opcional (`ROLEOS_BUDGET_CONSULT`), consultiva (nunca bloqueia um despacho) e com fallback para uma linha de base determinística. Desativado por padrão; a previsão é local e gratuita. Consulte o [manual](https://mcp-tool-shop-org.github.io/role-os/handbook/specialist-budget/).
|
|
91
|
+
|
|
92
|
+
## Estado de implantação em toda a organização
|
|
93
|
+
|
|
94
|
+
O estado de implantação em toda a organização (fila, decisões, registros de auditoria, pacotes de bloqueio por repositório) está armazenado em um repositório privado separado: [`role-os-rollout`](https://github.com/mcp-tool-shop-org/role-os-rollout). Este repositório é o produto; aquele repositório é o estado operacional.
|
|
91
95
|
|
|
92
96
|
## Memória e continuidade
|
|
93
97
|
|
|
94
|
-
O Role OS não possui nem duplica a camada de memória. Onde a memória do projeto Claude existe, ela é o sistema de continuidade canônico —
|
|
98
|
+
O Role OS não possui nem duplica a camada de memória. Onde a memória do projeto Claude existe, ela é o sistema de continuidade canônico — fatos do repositório, decisões, tarefas pendentes e histórico de tratamento estão armazenados lá.
|
|
95
99
|
|
|
96
|
-
O Role OS se integra
|
|
100
|
+
O Role OS se integra à memória do projeto Claude. Ele não a substitui.
|
|
97
101
|
|
|
98
|
-
## Tratamento completo e verificação de
|
|
102
|
+
## Tratamento completo e verificação de lançamento
|
|
99
103
|
|
|
100
|
-
O tratamento completo é um protocolo canônico de 7 fases definido na memória do projeto Claude (`memory/full-treatment.md`). O Role OS
|
|
104
|
+
O tratamento completo é um protocolo canônico de 7 fases definido na memória do projeto Claude (`memory/full-treatment.md`). O Role OS roteia e revisa os tratamentos usando contratos de função, transferências e portões de críticos — ele não redefine o protocolo.
|
|
101
105
|
|
|
102
|
-
|
|
106
|
+
**Verificação de lançamento** é o portão de qualidade de 31 itens que é executado antes do tratamento completo. Os portões rígidos A-D devem ser aprovados antes que qualquer tratamento comece. Referência canônica: `memory/shipcheck.md`.
|
|
103
107
|
|
|
104
|
-
Ordem: Verificação de
|
|
108
|
+
Ordem: Verificação de lançamento primeiro, depois tratamento completo. Sem v1.0.0 sem a aprovação dos portões rígidos.
|
|
105
109
|
|
|
106
|
-
##
|
|
110
|
+
## 61 funções em 10 pacotes
|
|
107
111
|
|
|
108
112
|
| Pacote | Funções |
|
|
109
113
|
|------|-------|
|
|
110
|
-
| **Core** (3) |
|
|
111
|
-
| **Engineering** (7) | Desenvolvedor
|
|
112
|
-
| **Design** (2) | Designer de
|
|
113
|
-
| **Marketing** (1) | Redator
|
|
114
|
-
| **Treatment** (7) | Pesquisador de
|
|
115
|
-
| **Product** (3) | Sintetizador de
|
|
116
|
-
| **Research** (4) | Pesquisador de
|
|
114
|
+
| **Core** (3) | Orquestrador, Estrategista de Produto, Revisor Crítico |
|
|
115
|
+
| **Engineering** (7) | Desenvolvedor Frontend, Engenheiro Backend, Engenheiro de Testes, Engenheiro de Refatoração, Engenheiro de Desempenho, Auditor de Dependências, Revisor de Segurança |
|
|
116
|
+
| **Design** (2) | Designer de UI, Guardião da Marca |
|
|
117
|
+
| **Marketing** (1) | Redator de Conteúdo de Lançamento |
|
|
118
|
+
| **Treatment** (7) | Pesquisador de Repositório, Tradutor de Repositório, Arquiteto de Documentação, Curador de Metadados, Auditor de Cobertura, Verificador de Implantação, Engenheiro de Lançamento |
|
|
119
|
+
| **Product** (3) | Sintetizador de Feedback, Priorizador de Roadmap, Redator de Especificações |
|
|
120
|
+
| **Research** (4) | Pesquisador de UX, Analista Competitivo, Pesquisador de Tendências, Sintetizador de Entrevistas com Usuários |
|
|
117
121
|
| **Growth** (4) | Estrategista de Lançamento, Estrategista de Conteúdo, Gerente de Comunidade, Líder de Triagem de Suporte |
|
|
122
|
+
| **Deep Audit** (4) | Auditor de Componentes, Auditor de Verdade de Testes, Auditor de Interface, Sintetizador de Auditoria |
|
|
123
|
+
| **Swarm** (7) | Coordenador de Grupo, Agente Backend do Grupo, Agente de Ponte do Grupo, Agente de Testes do Grupo, Agente de Infraestrutura do Grupo, Agente Frontend do Grupo, Sintetizador do Grupo |
|
|
118
124
|
|
|
119
|
-
Cada função tem um contrato completo: missão, quando usar, quando não usar, entradas esperadas, saídas necessárias, padrão de qualidade e gatilhos de escalonamento. Cada função pode ser
|
|
125
|
+
Cada função tem um contrato completo: missão, quando usar, quando não usar, entradas esperadas, saídas necessárias, padrão de qualidade e gatilhos de escalonamento. Cada função pode ser roteada — `roleos route` pode recomendar qualquer uma delas com base no conteúdo do pacote.
|
|
120
126
|
|
|
121
|
-
##
|
|
127
|
+
## Guia rápido
|
|
122
128
|
|
|
123
129
|
```bash
|
|
124
130
|
npx role-os init
|
|
@@ -133,6 +139,19 @@ roleos complete artifact.md # Complete with artifact
|
|
|
133
139
|
roleos explain # Show full state
|
|
134
140
|
roleos report # Completion report
|
|
135
141
|
|
|
142
|
+
# Deep audit:
|
|
143
|
+
roleos audit manifest --generate # Create audit-manifest.json
|
|
144
|
+
roleos audit # Start component-level deep audit
|
|
145
|
+
roleos audit status # Check audit progress
|
|
146
|
+
roleos audit verify # Verify manifest and outputs
|
|
147
|
+
|
|
148
|
+
# Dogfood swarm:
|
|
149
|
+
roleos swarm manifest --generate # Auto-detect domains from repo structure
|
|
150
|
+
roleos swarm # Start multi-pass convergence swarm
|
|
151
|
+
roleos swarm status # Check swarm progress by stage
|
|
152
|
+
roleos swarm findings # List findings by severity
|
|
153
|
+
roleos swarm approve # Approve feature gate
|
|
154
|
+
|
|
136
155
|
# Or go manual:
|
|
137
156
|
roleos start "fix the crash" # Entry decision only (no run)
|
|
138
157
|
roleos packet new feature
|
|
@@ -146,55 +165,55 @@ roleos packs list
|
|
|
146
165
|
|
|
147
166
|
## Quando não usar o Role OS
|
|
148
167
|
|
|
149
|
-
- Correções
|
|
150
|
-
- Pesquisa exploratória sem
|
|
168
|
+
- Correções pontuais, erros de digitação ou bugs óbvios
|
|
169
|
+
- Pesquisa exploratória sem resultados definidos
|
|
151
170
|
- Trabalho que cabe na cabeça de uma pessoa em 5 minutos
|
|
152
|
-
- Correções
|
|
153
|
-
- Projetos
|
|
171
|
+
- Correções de emergência que precisam ser implementadas antes que a cadeia de revisão seja concluída
|
|
172
|
+
- Projetos em que você prioriza a velocidade em vez da estrutura
|
|
154
173
|
|
|
155
174
|
## Evidências
|
|
156
175
|
|
|
157
|
-
O Role OS foi comprovado em três
|
|
176
|
+
O Role OS foi comprovado em três cenários de teste em dois repositórios estruturalmente diferentes:
|
|
158
177
|
|
|
159
|
-
**Teste 001 — Trabalho
|
|
160
|
-
- Cadeia de 7 funções, 45 cenários de teste, 0
|
|
161
|
-
-
|
|
178
|
+
**Teste 001 — Trabalho em funcionalidades** (Tela da equipe, Star Freight)
|
|
179
|
+
- Cadeia de 7 funções, 45 cenários de teste, 0 conflitos de funções
|
|
180
|
+
- Evitou a contaminação de um ancestral de fork, detectou invenções em tempo real e identificou obstáculos reais
|
|
162
181
|
|
|
163
|
-
**Teste 002 — Trabalho de integração** (
|
|
164
|
-
- Cadeia de 5 funções, resolveu
|
|
165
|
-
- Testes anti-fallback
|
|
182
|
+
**Teste 002 — Trabalho de integração** (Configuração do CampaignState, Star Freight)
|
|
183
|
+
- Cadeia de 5 funções, resolveu uma lacuna arquitetônica sem recorrer a soluções alternativas
|
|
184
|
+
- Testes anti-fallback comprovaram que o caminho ativo é real, não apenas um espaço reservado
|
|
166
185
|
|
|
167
|
-
**Teste 003 — Trabalho de identidade** (
|
|
168
|
-
- Cadeia de 6 funções, 51 cenários de teste, incluindo defesa
|
|
169
|
-
- Corrigiu
|
|
186
|
+
**Teste 003 — Trabalho de identidade** (Purga de contaminação, Star Freight)
|
|
187
|
+
- Cadeia de 6 funções, 51 cenários de teste, incluindo defesa duradoura contra contaminação no CI
|
|
188
|
+
- Corrigiu desvios de informações herdadas sem levar a um redesenho amplo
|
|
170
189
|
|
|
171
|
-
**Teste de portabilidade** (Consistência da persona,
|
|
172
|
-
- Mesma estrutura
|
|
173
|
-
-
|
|
190
|
+
**Teste de portabilidade** (Consistência da persona, humor do sensor)
|
|
191
|
+
- Mesma estrutura, linguagem/domínio/pilha diferentes
|
|
192
|
+
- Adotado com apenas alterações de contexto — sem modificações no contrato principal
|
|
174
193
|
|
|
175
|
-
**Tratamento
|
|
176
|
-
- Tratamento
|
|
177
|
-
-
|
|
194
|
+
**Tratamento completo FT-001** (portlight-desktop)
|
|
195
|
+
- Tratamento em 7 fases com funções do Treatment Pack
|
|
196
|
+
- Comprovação do controle de Shipcheck, zero conflitos de funções
|
|
178
197
|
|
|
179
|
-
**Tratamento
|
|
180
|
-
- Mesmo
|
|
181
|
-
-
|
|
198
|
+
**Tratamento completo FT-002** (studioflow)
|
|
199
|
+
- Mesmo Treatment Pack, repositório estruturalmente diferente (espaço de trabalho criativo versus jogo)
|
|
200
|
+
- Treatment Pack portátil — nenhuma modificação no contrato necessária
|
|
182
201
|
|
|
183
|
-
**Sessão de brainstorming
|
|
184
|
-
- Cadeia de 9
|
|
185
|
-
- 4 desafios
|
|
186
|
-
- Mais de 16 links de rastreamento
|
|
187
|
-
- Cadeia de custódia
|
|
202
|
+
**Sessão de brainstorming** (tópico do mercado do servidor MCP)
|
|
203
|
+
- Cadeia de 9 funções, 4 analistas em paralelo, análise cruzada + refutação do gráfico de disputa
|
|
204
|
+
- 4 desafios lançados, 3 alegações restritas, 1 não resolvida — pressão saudável, não um impasse
|
|
205
|
+
- Mais de 16 links de rastreamento de artefatos renderizados de volta aos átomos da camada de verdade
|
|
206
|
+
- Cadeia completa de custódia comprovada: verdade → átomos → disputa → síntese → expansão → julgamento → renderização → rastreamento
|
|
188
207
|
|
|
189
|
-
## Propriedades
|
|
208
|
+
## Propriedades principais
|
|
190
209
|
|
|
191
|
-
Estas são inegociáveis. Se uma alteração enfraquecer
|
|
210
|
+
Estas são inegociáveis. Se uma alteração enfraquecer alguma delas, rejeite-a.
|
|
192
211
|
|
|
193
|
-
- Os limites
|
|
194
|
-
- A revisão é rigorosa
|
|
195
|
-
- A
|
|
196
|
-
- Os pacotes permanecem testáveis
|
|
197
|
-
- A portabilidade requer adaptação
|
|
212
|
+
- Os limites das funções são mantidos
|
|
213
|
+
- A revisão é rigorosa
|
|
214
|
+
- A escalada permanece honesta
|
|
215
|
+
- Os pacotes permanecem testáveis
|
|
216
|
+
- A portabilidade requer adaptação de contexto, não cirurgia no núcleo
|
|
198
217
|
|
|
199
218
|
## Estrutura do projeto
|
|
200
219
|
|
|
@@ -206,18 +225,23 @@ role-os/
|
|
|
206
225
|
entry-cmd.mjs ← `roleos start` CLI command
|
|
207
226
|
run.mjs ← Persistent run engine: create → step → pause → resume → report
|
|
208
227
|
run-cmd.mjs ← `roleos run/resume/next/explain/complete/fail` + interventions
|
|
209
|
-
mission.mjs ←
|
|
228
|
+
mission.mjs ← 9 named mission types (feature, bugfix, treatment, docs, security, research, brainstorm, deep-audit, dogfood-swarm)
|
|
210
229
|
mission-run.mjs ← Mission runner: create → step → complete → report
|
|
211
230
|
mission-cmd.mjs ← `roleos mission` CLI commands
|
|
212
|
-
|
|
213
|
-
|
|
231
|
+
audit-cmd.mjs ← `roleos audit` — deep audit entry point with manifest generation
|
|
232
|
+
swarm-cmd.mjs ← `roleos swarm` — dogfood swarm entry point with domain detection
|
|
233
|
+
swarm/ ← Domain detection, build gate, evidence persistence bridge
|
|
234
|
+
route.mjs ← 61-role routing + dynamic chain builder
|
|
235
|
+
packs.mjs ← 10 calibrated team packs + auto-selection
|
|
214
236
|
conflicts.mjs ← 4-pass conflict detection
|
|
215
237
|
escalation.mjs ← Auto-routing for blocked/rejected/split
|
|
216
238
|
evidence.mjs ← Structured evidence + role-aware requirements
|
|
217
239
|
dispatch.mjs ← Runtime dispatch manifests for multi-claude
|
|
218
|
-
|
|
240
|
+
tool-profiles.mjs ← Per-role tool sandboxing (shared by dispatch + trial)
|
|
241
|
+
state-machine.mjs ← Canonical step/run transition maps
|
|
242
|
+
artifacts.mjs ← Per-role artifact contracts + pack handoffs
|
|
219
243
|
decompose.mjs ← Composite task detection + splitting
|
|
220
|
-
composite.mjs ← Dependency-ordered execution + recovery
|
|
244
|
+
composite.mjs ← Dependency-ordered execution + recovery + cycle detection
|
|
221
245
|
replan.mjs ← Mid-run adaptive replanning
|
|
222
246
|
calibration.mjs ← Outcome recording + weight tuning
|
|
223
247
|
hooks.mjs ← 5 lifecycle hooks for runtime enforcement
|
|
@@ -225,56 +249,60 @@ role-os/
|
|
|
225
249
|
brainstorm.mjs ← Evidence modes, request validation, finding/synthesis/judge schemas
|
|
226
250
|
brainstorm-roles.mjs ← Role-native schemas, input partitioning, blindspot enforcement, cross-exam
|
|
227
251
|
brainstorm-render.mjs ← Two-layer rendering: lexical bans, render schemas, debate transcript
|
|
228
|
-
test/ ←
|
|
252
|
+
test/ ← 1150 tests across 37 test files
|
|
229
253
|
starter-pack/ ← Drop-in role contracts, policies, schemas, workflows
|
|
230
254
|
```
|
|
231
255
|
|
|
232
256
|
## Segurança
|
|
233
257
|
|
|
234
|
-
O
|
|
258
|
+
O Role OS opera **apenas localmente**. Ele copia modelos Markdown e grava arquivos de pacote/veredicto no diretório `.claude/` do seu repositório. Ele não acessa a rede, manipula segredos ou coleta dados de telemetria. Nenhuma operação perigosa — todas as gravações de arquivos usam o recurso "ignorar se já existir" por padrão. Consulte [SECURITY.md](SECURITY.md) para obter a política completa.
|
|
235
259
|
|
|
236
260
|
## O sistema operacional
|
|
237
261
|
|
|
238
|
-
| Camada
|
|
262
|
+
| Camada | O que ele faz | Status |
|
|
239
263
|
|-------|-------------|--------|
|
|
240
|
-
| **Routing** | Avalia todas as
|
|
241
|
-
| **Chain builder** | Monta cadeias ordenadas por fase a partir de funções
|
|
242
|
-
| **Conflict detection** | Validação em 4 etapas: conflitos graves, sequência, redundância, lacunas de cobertura. Sugestões de correção. | ✓ Implementado
|
|
243
|
-
| **Escalation** |
|
|
244
|
-
| **Evidence** | Evidências estruturadas
|
|
245
|
-
| **Dispatch** | Gera manifestos de execução para multi-claude. Perfis de ferramentas por função, prompts do sistema, orçamentos. | ✓ Implementado
|
|
246
|
-
| **Trials** | Conjunto completo comprovado: 30/30 tarefas de
|
|
247
|
-
| **Team Packs** |
|
|
248
|
-
| **Outcome calibration** | Registra os resultados da execução, ajusta os pesos
|
|
249
|
-
| **Mixed-task decomposition** | Detecta
|
|
250
|
-
| **Composite execution** | Executa pacotes filhos
|
|
251
|
-
| **Adaptive replanning** | Alterações de escopo, descobertas ou novos requisitos durante a execução atualizam o plano sem
|
|
252
|
-
| **Session spine** | `roleos init claude` cria os arquivos CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica
|
|
253
|
-
| **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicação
|
|
254
|
-
| **Artifact spine** |
|
|
255
|
-
| **Mission library** |
|
|
256
|
-
| **Mission runner** |
|
|
257
|
-
| **Unified entry** | `roleos start` decide automaticamente entre missão, pacote ou roteamento livre.
|
|
258
|
-
| **Persistent runs** | `roleos run` cria execuções
|
|
259
|
-
| **Brainstorm** | Arquitetura de duas camadas: verdade (esquemas nativos
|
|
260
|
-
|
|
261
|
-
|
|
264
|
+
| **Routing** | Avalia todas as 61 funções em relação ao conteúdo do pacote, explica as recomendações e avalia a confiança | ✓ Implementado |
|
|
265
|
+
| **Chain builder** | Monta cadeias ordenadas por fase a partir de funções avaliadas, com viés para o tipo de pacote, mas não restrito a modelos | ✓ Implementado |
|
|
266
|
+
| **Conflict detection** | Validação em 4 etapas: conflitos graves, sequência, redundância, lacunas de cobertura. Sugestões de correção. | ✓ Implementado |
|
|
267
|
+
| **Escalation** | Roteia automaticamente o trabalho bloqueado/rejeitado/dividido para o resolvedor correto, com razão + artefato necessário | ✓ Implementado |
|
|
268
|
+
| **Evidence** | Evidências estruturadas e conscientes da função nos veredictos. Verificações de suficiência. 12 tipos de evidências. | ✓ Implementado |
|
|
269
|
+
| **Dispatch** | Gera manifestos de execução para multi-claude. Perfis de ferramentas por função, prompts do sistema, orçamentos. | ✓ Implementado |
|
|
270
|
+
| **Trials** | Conjunto completo comprovado: 30/30 tarefas de ouro + 5/5 testes negativos. 7 testes de pacote concluídos. | ✓ Completo |
|
|
271
|
+
| **Team Packs** | 10 pacotes calibrados com seleção automática, proteções contra incompatibilidade e fallback de roteamento livre. | ✓ Implementado |
|
|
272
|
+
| **Outcome calibration** | Registra os resultados da execução, ajusta os pesos do pacote/função com base nos resultados e ajusta os limites de confiança. | ✓ Implementado |
|
|
273
|
+
| **Mixed-task decomposition** | Detecta trabalho composto, divide em pacotes filhos, atribui pacotes e preserva as dependências. | ✓ Implementado |
|
|
274
|
+
| **Composite execution** | Executa os pacotes filhos em ordem de dependência, com passagem de artefatos, recuperação de ramificações e síntese. | ✓ Implementado |
|
|
275
|
+
| **Adaptive replanning** | Alterações de escopo, descobertas ou novos requisitos durante a execução atualizam o plano sem reiniciar. | ✓ Implementado |
|
|
276
|
+
| **Session spine** | `roleos init claude` cria os arquivos CLAUDE.md, /roleos-route, /roleos-review, /roleos-status. `roleos doctor` verifica a configuração. Os cartões de roteamento comprovam o envolvimento. | ✓ Implementado |
|
|
277
|
+
| **Hook spine** | 5 ganchos de ciclo de vida (SessionStart, PromptSubmit, PreToolUse, SubagentStart, Stop). Aplicação consultiva: lembretes do cartão de roteamento, controle de escrita de ferramentas, injeção de função de subagente, auditoria de conclusão. | ✓ Implementado |
|
|
278
|
+
| **Artifact spine** | Contratos de artefato por função. Contratos de transferência de pacote. Validação estrutural. Verificações de integridade da cadeia. As funções a jusante nunca adivinham o que receberam. | ✓ Implementado |
|
|
279
|
+
| **Mission library** | 9 missões nomeadas (feature-ship, bugfix, treatment, docs-release, security-hardening, research-launch, brainstorm, deep-audit, dogfood-swarm). Cada uma declara o pacote, a cadeia de funções, o fluxo de artefatos, as ramificações de escalada e a definição honesta-parcial. | ✓ Implementado |
|
|
280
|
+
| **Mission runner** | Crie execuções, percorra-as com estado rastreado, complete/falhe com relatórios honestos. Propagação de etapas bloqueadas, avisos de escalada fora da cadeia, reabertura da última etapa. | ✓ Implementado |
|
|
281
|
+
| **Unified entry** | `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Escada de fallback com pontuações de confiança, alternativas e detecção de composição. | ✓ Implementado |
|
|
282
|
+
| **Persistent runs** | `roleos run` cria execuções armazenadas em disco. `resume`, `next`, `explain`, `complete`, `fail`. Intervenções: reroute, escalate, retry, block, reopen. Orientação local da etapa. Medição de atrito. | ✓ Implementado |
|
|
283
|
+
| **Brainstorm** | Arquitetura de duas camadas: verdade (esquemas nativos da função, átomos de proveniência, gráfico de disputa de análise cruzada) + renderização (5 vozes distintas, proibições lexicais, transcrição do debate). Os links de rastreamento comprovam que cada afirmação renderizada se relaciona com um átomo de verdade. Execução de ouro comprovada. | ✓ Implementado |
|
|
284
|
+
| **Deep Audit** | Auditoria de repositório com base no manifesto: decompor o repositório em componentes, enviar N auditores + M auditores de testes de verificação + K auditores de interface a partir do grafo de dependências, sintetizar em um veredicto classificado e plano de ação. O envio dinâmico é dimensionado de acordo com o tamanho do repositório (fórmula 2N + K + 3). Nativo do executor, com validação de artefatos em cada etapa. | ✓ Implementado |
|
|
285
|
+
| **Dogfood Swarm** | Convergência de múltiplas etapas: três estágios de saúde (bug/segurança → proativo → humanização) e, em seguida, etapa de recursos. Propriedade exclusiva de arquivos, barreiras de construção após cada iteração, pontos de verificação do usuário. A detecção automática de domínio gera manifestos. Ponte de evidências para os laboratórios de testes internos. | ✓ Implementado |
|
|
286
|
+
|
|
287
|
+
## 9 missões
|
|
262
288
|
|
|
263
289
|
| Missão | Pacote | Funções | Quando usar |
|
|
264
290
|
|---------|------|-------|-------------|
|
|
265
|
-
| `feature-ship` |
|
|
266
|
-
| `bugfix` | Correção de bug
|
|
267
|
-
| `treatment` | Tratamento | 4 | Verificação +
|
|
268
|
-
| `docs-release` | Documentação | 2 | Escrever/atualizar documentação, notas de lançamento |
|
|
269
|
-
| `security-hardening` | Segurança | 4 | Modelo de ameaças, auditoria, correção de vulnerabilidades,
|
|
270
|
-
| `research-launch` | Pesquisa | 4 | Formular a pergunta, pesquisar, documentar
|
|
271
|
-
| `brainstorm` |
|
|
272
|
-
|
|
273
|
-
|
|
291
|
+
| `feature-ship` | Recurso | 5 | Entrega completa de recursos: escopo → especificação → implementação → teste → revisão |
|
|
292
|
+
| `bugfix` | Correção de bug | 4 | Diagnosticar a causa raiz, corrigir, testar, verificar |
|
|
293
|
+
| `treatment` | Tratamento | 4 | Verificação de envio + refinamento + documentação + verificação de CI + revisão |
|
|
294
|
+
| `docs-release` | Documentação | 2 | Escrever/atualizar a documentação, notas de lançamento |
|
|
295
|
+
| `security-hardening` | Segurança | 4 | Modelo de ameaças, auditoria, correção de vulnerabilidades, reauditoria, verificação |
|
|
296
|
+
| `research-launch` | Pesquisa | 4 | Formular a pergunta, pesquisar, documentar as descobertas, decidir |
|
|
297
|
+
| `brainstorm` | Brainstorming | 9 | Análise estruturada e multiperspectiva com discordância e veredicto rastreáveis |
|
|
298
|
+
| `deep-audit` | Auditoria aprofundada | 5 (escalas) | Auditoria de repositório com base no manifesto — o número de trabalhadores é dimensionado de acordo com o grafo do repositório por meio de envio dinâmico |
|
|
299
|
+
| `dogfood-swarm` | Enxame | 8 (escalas) | Convergência de múltiplas etapas: saúde-a → saúde-b → saúde-c → recurso → síntese final |
|
|
300
|
+
|
|
301
|
+
Cada missão inclui definições honestas e parciais — quando o trabalho é interrompido, o sistema documenta o que foi concluído e o que resta, em vez de fingir que tudo foi concluído.
|
|
274
302
|
|
|
275
303
|
### Missão de brainstorming
|
|
276
304
|
|
|
277
|
-
Não é "brainstorming de IA". A missão de brainstorming é **
|
|
305
|
+
Não é um "brainstorming de IA". A missão de brainstorming é composta por **funções especializadas sob a lei, com discordância e resultados que levam a um veredicto rastreáveis.**
|
|
278
306
|
|
|
279
307
|
```bash
|
|
280
308
|
roleos run "explore product directions for a developer tool discovery platform"
|
|
@@ -282,33 +310,61 @@ roleos run "explore product directions for a developer tool discovery platform"
|
|
|
282
310
|
# Chain: 4 Analysts (parallel) → Normalize → Cross-Examine → Rebut → Synthesize → Expand → Judge
|
|
283
311
|
```
|
|
284
312
|
|
|
285
|
-
**O que a
|
|
313
|
+
**O que a torna diferente:**
|
|
314
|
+
|
|
315
|
+
- **Camada 1 (verdade):** Quatro analistas emitem esquemas nativos de função (ContextMap, UserValueMap, MechanicsMap, PositioningMap) — não é uma prosa compartilhada. Cada função tem pontos cegos aplicados: frases proibidas, tipos de afirmações proibidas, partições de entrada filtradas. Os átomos carregam a proveniência. Um grafo de questionamento cruzado direcionado produz desafios direcionados. Os analistas originais defendem, restringem ou retiram suas afirmações sob pressão.
|
|
316
|
+
|
|
317
|
+
- **Camada 2 (renderização):** Cinco vozes humanas distintas (Memorando de Limites, Notas de Campo, Esboço do Sistema, Resumo de Afirmações, Transcrição do Questionamento Cruzado) com proibições lexicais que impedem a convergência das vozes. A síntese consome a verdade, nunca a prosa renderizada. Ambas as camadas estão sempre disponíveis.
|
|
318
|
+
|
|
319
|
+
- **Cadeia de custódia:** Cada frase renderizada rastreia até um átomo da camada de verdade. As direções de síntese citam átomos. Os alvos do questionamento cruzado são IDs de afirmações reais. O grafo de disputa é o produto, não a prosa.
|
|
320
|
+
|
|
321
|
+
**Comprovado:** Execução de referência v0.4 — cadeia de custódia completa verificada. Consulte [`examples/golden-run.md`](examples/golden-run.md) para a cadeia completa de artefatos.
|
|
322
|
+
|
|
323
|
+
### Missão de auditoria aprofundada
|
|
324
|
+
|
|
325
|
+
Não é uma varredura superficial. A missão de auditoria aprofundada **decompõe um repositório em componentes delimitados e envia auditores especializados em uma escala determinada pelo próprio grafo de dependências do repositório.**
|
|
286
326
|
|
|
287
|
-
|
|
327
|
+
```bash
|
|
328
|
+
roleos run "deep audit this repo" --manifest=audit-manifest.json
|
|
329
|
+
# → MISSION: Deep Audit (Manifest-Scaled)
|
|
330
|
+
# Steps: Component Auditor ×6 + Test Truth Auditor ×6 + Seam Auditor ×8 + Synthesizer + Action Plan + Critic = 23 steps
|
|
331
|
+
```
|
|
332
|
+
|
|
333
|
+
**O que a torna diferente:**
|
|
334
|
+
|
|
335
|
+
- **Envio dinâmico:** o número de trabalhadores não é fixo. Um repositório de 10 componentes com 5 clusters de limites produz 28 etapas (2 × 10 + 5 + 3). Um repositório de 3 componentes produz 12. A fórmula de dimensionamento é `2N + K + 3`, onde N = componentes, K = limites.
|
|
336
|
+
- **Pacotes com base no manifesto:** um arquivo `audit-manifest.json` define os componentes (com caminhos de arquivo, contagem de linhas, descrições) e os limites (de/para com descrições da interface). Cada auditor recebe apenas seu pacote.
|
|
337
|
+
- **Quatro arquétipos de função:** Auditor de Componentes (verdade do código por módulo), Auditor de Testes de Verificação (testes que comprovam vs. testes que existem), Auditor de Interface (limites de integração do grafo de dependências), Sintetizador de Auditoria (veredicto classificado + plano de ação de todos os pacotes).
|
|
338
|
+
- **Validação de artefatos em cada etapa:** `validateArtifact()` é acionado em cada etapa de conclusão em ambos os caminhos de execução. Os resultados são anexados aos objetos de etapa. O sistema sabe se cada artefato atendeu ao seu contrato.
|
|
339
|
+
- **Honestidade parcial:** quando o orçamento ou o escopo impedem a conclusão, as descobertas por componente são individualmente válidas. O sistema sintetiza a partir do que foi concluído, nunca finge cobertura total.
|
|
340
|
+
|
|
341
|
+
**Comprovado:** Execução nativa do executor — 18 testes em um manifesto real, ciclo de vida completo verificado, incluindo reabertura de escalonamento e falha parcial. A fórmula de dimensionamento foi verificada para manifestos de 3/6/10/15 componentes.
|
|
342
|
+
|
|
343
|
+
### Missão de enxame de testes internos
|
|
344
|
+
|
|
345
|
+
Não é uma varredura única. A missão de enxame de testes internos **executa um protocolo de convergência de múltiplas etapas que move um repositório de "funciona" para "pronto para produção" por meio de três estágios de saúde e entrega iterativa de recursos.**
|
|
346
|
+
|
|
347
|
+
```bash
|
|
348
|
+
roleos swarm
|
|
349
|
+
# → MISSION: Dogfood Swarm (Multi-Pass Convergence)
|
|
350
|
+
# Stages: Health-A → Health-B → Health-C → Feature → Final
|
|
351
|
+
# Domain agents: 3-5 parallel per wave (exclusive file ownership)
|
|
352
|
+
```
|
|
288
353
|
|
|
289
|
-
|
|
354
|
+
**O que a torna diferente:**
|
|
290
355
|
|
|
291
|
-
- **
|
|
356
|
+
- **Sistema de validação em três etapas** — A etapa A corrige erros e problemas de segurança (ciclo até que não haja mais erros CRÍTICOS ou de ALTA prioridade). A etapa B aplica medidas de segurança proativas (os utilizadores avaliam os resultados). A etapa C torna o código mais intuitivo — mensagens de erro que ajudam os utilizadores, feedback de reconexão, estados de carregamento, acessibilidade. Cada etapa é uma lente distinta, não a mesma análise repetida.
|
|
357
|
+
- **Propriedade exclusiva de ficheiros** — cada agente de domínio possui ficheiros específicos através do ficheiro `swarm-manifest.json`. Nenhum dos agentes edita o mesmo ficheiro. Não há conflitos de fusão. Não há sobrecarga de coordenação.
|
|
358
|
+
- **Controles de construção** — a análise de código, a verificação de tipos e os testes devem ser aprovados após cada ciclo. O sistema deteta automaticamente o sistema de construção (Node, Rust, Python, Go) e executa os comandos corretos.
|
|
359
|
+
- **Pontos de verificação do utilizador** — a etapa de validação (Health-B) e a etapa de funcionalidades exigem a aprovação explícita do utilizador antes da execução. O sistema apresenta os resultados e o utilizador decide o que construir.
|
|
360
|
+
- **Convergência iterativa** — as etapas são executadas em ciclos, juntamente com os ciclos de validação, até que as condições de saída sejam cumpridas ou o número máximo de iterações seja atingido. Cada ciclo reavalia tudo desde o início para detetar regressões introduzidas por correções anteriores.
|
|
361
|
+
- **Deteção automática de domínio** — o comando `roleos swarm manifest --generate` deteta o tipo de repositório (CLI, web, desktop, MCP, monorepo) e gera atribuições de domínio não sobrepostas.
|
|
292
362
|
|
|
293
|
-
**Comprovado:**
|
|
363
|
+
**Comprovado:** claude-collaborate (2026-03-28) — 35→129 testes, 106 problemas de validação corrigidos, versão v1.1.0 lançada. Protocolo v2.0 com 9 fases.
|
|
294
364
|
|
|
295
365
|
## Status
|
|
296
366
|
|
|
297
|
-
|
|
298
|
-
- v1.0.0: 32 funções, CLI completa, tratamento comprovado, portabilidade multi-repositório.
|
|
299
|
-
- v1.0.2: Bloqueio do sistema operacional para funções (correções de inicialização, `init --force`).
|
|
300
|
-
- v1.1.0: 31 funções, roteamento completo, detecção de conflitos, escalonamento, evidências, despacho, 7 pacotes de equipe comprovados. 35 testes de execução. 212 testes.
|
|
301
|
-
- v1.2.0: Pacotes calibrados promovidos a entrada padrão. Seleção automática, detecção de incompatibilidades, sugestão alternativa, fallback de roteamento livre. 246 testes.
|
|
302
|
-
- v1.3.0: Calibração de resultados, decomposição de tarefas mistas, execução composta, replanejamento adaptativo. 317 testes.
|
|
303
|
-
- v1.4.0: Espinha dorsal da sessão — `roleos init claude`, `roleos doctor`, cartões de rota, comandos `/roleos-route + /roleos-review + /roleos-status`. 335 testes.
|
|
304
|
-
- v1.5.0: Espinha dorsal de hooks — 5 hooks de ciclo de vida para aplicação em tempo de execução. 358 testes.
|
|
305
|
-
- v1.6.0: Espinha dorsal de artefatos — 20 contratos de artefatos por função, 7 contratos de transferência de pacotes, validação estrutural. 385 testes.
|
|
306
|
-
- v1.7.0: Prova de conclusão — tarefas reais executadas em toda a pilha. CLI `roleos artifacts`. Escalabilidade honesta para correções estruturais. 398 testes.
|
|
307
|
-
- v1.8.0: Biblioteca de missões (Fase S) — 6 missões nomeadas, motor de execução, relatórios de conclusão. Reforçado com 6 execuções de teste reais. 481 testes.
|
|
308
|
-
- v1.9.0: Caminho de entrada unificado (Fase T) — `roleos start` decide automaticamente entre missão, pacote ou roteamento livre. Escada de fallback, detecção composta, testes de comparação de caminho de entrada. 527 testes.
|
|
309
|
-
- **v2.0.0**: Otimização da experiência do usuário (Fase U) — `roleos run` cria execuções persistentes com backup em disco. Retomar, próximo, explicar, completar, falhar. Intervenções: redirecionar, escalar, tentar novamente, bloquear, reabrir. Orientação passo a passo em cada etapa. Medição de atrito. 6 testes de atrito. 613 testes.
|
|
310
|
-
- **v2.0.1**: Auditoria do manual, documentação para iniciantes, correções na contagem de testes. 617 testes.
|
|
311
|
-
- **v2.1.0**: Missão de brainstorming (v0.4) — funções especializadas sob a lei, desacordo rastreável, saída com valor de decisão. Arquitetura de duas camadas (verdade + renderização), matriz de permissão de interrogatório, grafo de disputas, prova de execução ideal. 7 missões, 50 funções, 8 pacotes. 894 testes.
|
|
367
|
+
Estável e em produção. Consulte o [REGISTO DE ALTERAÇÕES](CHANGELOG.md) para obter o histórico completo das versões e o que mudou em cada lançamento.
|
|
312
368
|
|
|
313
369
|
## Licença
|
|
314
370
|
|
|
@@ -316,4 +372,4 @@ MIT
|
|
|
316
372
|
|
|
317
373
|
---
|
|
318
374
|
|
|
319
|
-
|
|
375
|
+
Criado por <a href="https://mcp-tool-shop.github.io/">MCP Tool Shop</a>
|