npm - oxe-cc - Versions diffs - 1.8.0 → 1.8.3 - Mend

oxe-cc 1.8.0 → 1.8.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (44) hide show

package/CHANGELOG.md +63 -0
package/README.md +1 -1
package/bin/lib/oxe-manifest.cjs +20 -13
package/bin/lib/oxe-operational.cjs +96 -10
package/bin/lib/oxe-project-health.cjs +77 -18
package/bin/lib/oxe-rationality.cjs +9 -7
package/bin/oxe-cc.js +202 -39
package/lib/runtime/compiler/graph-compiler.js +1 -1
package/lib/runtime/executor/action-tool-map.js +4 -0
package/lib/runtime/executor/built-in-tools.js +27 -0
package/lib/runtime/executor/llm-task-executor.d.ts +4 -1
package/lib/runtime/executor/llm-task-executor.js +41 -5
package/lib/runtime/executor/node-prompt-builder.d.ts +4 -1
package/lib/runtime/executor/node-prompt-builder.js +13 -2
package/lib/runtime/models/failure.d.ts +1 -1
package/lib/runtime/scheduler/scheduler.d.ts +5 -1
package/lib/runtime/scheduler/scheduler.js +82 -14
package/lib/runtime/verification/verification-compiler.js +7 -5
package/lib/sdk/index.cjs +48 -44
package/oxe/templates/PLAN.template.md +23 -9
package/oxe/templates/SPEC.template.md +55 -22
package/oxe/workflows/plan.md +18 -6
package/oxe/workflows/spec.md +31 -9
package/package.json +103 -100
package/packages/runtime/package.json +18 -18
package/packages/runtime/src/compiler/graph-compiler.ts +1 -1
package/packages/runtime/src/evidence/evidence-store.ts +2 -2
package/packages/runtime/src/executor/action-tool-map.ts +4 -0
package/packages/runtime/src/executor/built-in-tools.ts +29 -0
package/packages/runtime/src/executor/llm-task-executor.ts +46 -4
package/packages/runtime/src/executor/node-prompt-builder.ts +18 -1
package/packages/runtime/src/models/failure.ts +2 -0
package/packages/runtime/src/scheduler/scheduler.ts +93 -15
package/packages/runtime/src/verification/verification-compiler.ts +7 -5
package/vscode-extension/package.json +185 -185
package/vscode-extension/oxe-agents-0.9.1.vsix +0 -0
package/vscode-extension/oxe-agents-0.9.2.vsix +0 -0
package/vscode-extension/oxe-agents-1.0.0.vsix +0 -0
package/vscode-extension/oxe-agents-1.4.0.vsix +0 -0
package/vscode-extension/oxe-agents-1.5.0.vsix +0 -0
package/vscode-extension/oxe-agents-1.5.1.vsix +0 -0
package/vscode-extension/oxe-agents-1.6.0.vsix +0 -0
package/vscode-extension/oxe-agents-1.7.0.vsix +0 -0
package/vscode-extension/oxe-agents-1.8.0.vsix +0 -0

package/lib/runtime/executor/node-prompt-builder.js CHANGED Viewed

@@ -1,7 +1,7 @@
 "use strict";
 Object.defineProperty(exports, "__esModule", { value: true });
 exports.buildNodePrompt = buildNodePrompt;
-function buildNodePrompt(node, lease, runId, attempt) {
+function buildNodePrompt(node, lease, runId, attempt, options = {}) {
     const lines = [
         `# Tarefa: ${node.title}`,
         '',
@@ -11,6 +11,14 @@ function buildNodePrompt(node, lease, runId, attempt) {
     if (node.mutation_scope.length > 0) {
         lines.push(`**Escopo de mutação:** ${node.mutation_scope.join(', ')}`);
     }
+    if (attempt > 1 && options.previousError) {
+        lines.push('', '## Contexto da tentativa anterior');
+        lines.push(`Esta é a tentativa **${attempt}**. A tentativa anterior falhou:`);
+        lines.push('', '```');
+        lines.push(String(options.previousError).slice(0, 2000));
+        lines.push('```', '');
+        lines.push('Analise o erro e tente uma abordagem diferente.');
+    }
     if (node.actions.length > 0) {
         lines.push('', '## Ações requeridas');
         for (const action of node.actions) {
@@ -31,6 +39,9 @@ function buildNodePrompt(node, lease, runId, attempt) {
     if (node.verify.command) {
         lines.push('', `**Verificação:** \`${node.verify.command}\``);
     }
-    lines.push('', 'Execute as ações acima usando as ferramentas disponíveis e confirme o resultado.');
+    lines.push('', '## Conclusão da tarefa');
+    lines.push('Quando **todas** as ações estiverem concluídas, chame `finish_task` com um resumo do que foi realizado.');
+    lines.push('NÃO chame `finish_task` antes de completar todas as ações requeridas.');
+    lines.push('', 'Execute as ações acima usando as ferramentas disponíveis.');
     return lines.join('\n');
 }

package/lib/runtime/models/failure.d.ts CHANGED Viewed

@@ -2,4 +2,4 @@
  * Canonical failure classification used by TaskResult and VerificationManifest.
  * Both must import from this file — never redefine inline.
  */
-export type FailureClass = 'env' | 'policy' | 'test' | 'timeout' | 'evidence_missing' | null;
+export type FailureClass = 'env' | 'policy' | 'test' | 'timeout' | 'evidence_missing' | 'verify' | 'llm' | null;

package/lib/runtime/scheduler/scheduler.d.ts CHANGED Viewed

@@ -14,9 +14,12 @@ export interface TaskResult {
     failure_class: FailureClass;
     evidence: string[];
     output: string;
+    completed_by?: string;
 }
 export interface TaskExecutor {
-    execute(node: GraphNode, lease: WorkspaceLease, runId: string, attemptNumber: number): Promise<TaskResult>;
+    execute(node: GraphNode, lease: WorkspaceLease, runId: string, attemptNumber: number, options?: {
+        previousError?: string | null;
+    }): Promise<TaskResult>;
 }
 export interface SchedulerOptions {
     maxRunDurationMs?: number;
@@ -70,6 +73,7 @@ export declare class Scheduler {
     getJournal(): RunJournal | null;
     static loadJournal(projectRoot: string, runId: string): RunJournal | null;
     private executeNode;
+    private verifyNode;
     private evaluatePolicyForNode;
     private requestGateForNode;
     private blockNode;

package/lib/runtime/scheduler/scheduler.js CHANGED Viewed

@@ -12,6 +12,7 @@ const audit_trail_1 = require("../audit/audit-trail");
 const run_journal_1 = require("./run-journal");
 const decision_memo_1 = require("../decision/decision-memo");
 const capability_adapter_1 = require("../plugins/capability-adapter");
+const verification_compiler_1 = require("../verification/verification-compiler");
 class Scheduler {
     constructor() {
         this.cancelled = false;
@@ -350,6 +351,7 @@ class Scheduler {
         });
         let lease = null;
         let lastResult = null;
+        let lastError = null;
         const maxAttempts = node.policy.max_retries + 1;
         const quotaBlocked = this.consumeQuotaForNode(ctx, node);
         if (quotaBlocked) {
@@ -408,19 +410,31 @@ class Scheduler {
                     attempt_id: attemptId,
                     payload: { workspace_id: lease.workspace_id, strategy: lease.strategy },
                 });
-                lastResult = await this.executeNode(node, lease, ctx, attempt, attemptId);
+                lastResult = await this.executeNode(node, lease, ctx, attempt, attemptId, { previousError: lastError });
                 if (lastResult.success) {
-                    this.emit(ctx, {
-                        type: 'WorkItemCompleted',
-                        work_item_id: nodeId,
-                        attempt_id: attemptId,
-                        payload: { attempt_number: attempt, evidence: lastResult.evidence },
-                    });
-                    status.set(nodeId, 'completed');
-                    completed.push(nodeId);
-                    this.recordProgress();
-                    return;
+                    const verifyResult = await this.verifyNode(node, lease, ctx, attemptId, attempt);
+                    if (verifyResult && verifyResult.status === 'failed') {
+                        lastResult = {
+                            success: false,
+                            failure_class: 'verify',
+                            evidence: lastResult.evidence,
+                            output: `Verification failed: ${(verifyResult.gaps || []).join('; ') || 'checks did not pass'}`,
+                        };
+                    }
+                    else {
+                        this.emit(ctx, {
+                            type: 'WorkItemCompleted',
+                            work_item_id: nodeId,
+                            attempt_id: attemptId,
+                            payload: { attempt_number: attempt, evidence: lastResult.evidence },
+                        });
+                        status.set(nodeId, 'completed');
+                        completed.push(nodeId);
+                        this.recordProgress();
+                        return;
+                    }
                 }
+                lastError = lastResult.output || (lastResult.failure_class ?? 'unknown error');
                 if (lastResult.failure_class === 'policy')
                     break;
                 if (attempt < maxAttempts) {
@@ -454,6 +468,7 @@ class Scheduler {
                     evidence: [],
                     output: `[error_boundary] ${message}`,
                 };
+                lastError = lastResult.output;
                 if (attempt < maxAttempts) {
                     const backoffMs = Math.min(1000 * Math.pow(2, attempt - 1) + Math.random() * 500, 30000);
                     await new Promise(resolve => setTimeout(resolve, backoffMs));
@@ -509,11 +524,11 @@ class Scheduler {
     static loadJournal(projectRoot, runId) {
         return (0, run_journal_1.loadJournal)(projectRoot, runId);
     }
-    async executeNode(node, lease, ctx, attempt, attemptId) {
+    async executeNode(node, lease, ctx, attempt, attemptId, options = {}) {
         const primaryAction = pickPrimaryAction(node, ctx.pluginRegistry);
         const provider = primaryAction ? ctx.pluginRegistry?.toolProviderFor(primaryAction.type) : null;
         if (!provider || !primaryAction) {
-            return ctx.executor.execute(node, lease, ctx.runId, attempt);
+            return ctx.executor.execute(node, lease, ctx.runId, attempt, options);
         }
         ctx.auditTrail?.record('plugin_invoked', ctx.policyActor ?? 'runtime', {
             runId: ctx.runId,
@@ -573,6 +588,57 @@ class Scheduler {
             output: result.output,
         };
     }
+    async verifyNode(node, lease, ctx, attemptId, attempt) {
+        if (!node.verify?.command)
+            return null;
+        this.emit(ctx, {
+            type: 'VerificationStarted',
+            work_item_id: node.id,
+            payload: { command: node.verify.command, attempt_number: attempt },
+        });
+        const suite = {
+            checks: [{
+                    id: `inline-${node.id}`,
+                    type: 'custom',
+                    command: node.verify.command,
+                    evidence_type_expected: 'stdout',
+                    acceptance_ref: null,
+                    description: `Verify ${node.id}`,
+                }],
+            compiled_at: new Date().toISOString(),
+            spec_hash: '',
+            plan_hash: '',
+        };
+        let result;
+        try {
+            result = await (0, verification_compiler_1.verifyRun)({
+                suite,
+                cwd: lease.root_path,
+                timeoutMs: ctx.options?.verifyTimeoutMs ?? 60000,
+                runId: ctx.runId,
+                workItemId: node.id,
+                attemptNumber: attempt,
+                projectRoot: ctx.projectRoot,
+                pluginRegistry: ctx.pluginRegistry,
+            });
+        }
+        catch (err) {
+            this.emit(ctx, {
+                type: 'VerificationCompleted',
+                work_item_id: node.id,
+                attempt_id: attemptId,
+                payload: { status: 'error', error: String(err) },
+            });
+            return null;
+        }
+        this.emit(ctx, {
+            type: 'VerificationCompleted',
+            work_item_id: node.id,
+            attempt_id: attemptId,
+            payload: { status: result.status },
+        });
+        return result;
+    }
     evaluatePolicyForNode(node, ctx) {
         if (!ctx.policyEngine)
             return null;
@@ -603,8 +669,10 @@ class Scheduler {
         return persisted;
     }
     async requestGateForNode(node, ctx, decision) {
-        if (!ctx.gateManager)
+        if (!ctx.gateManager) {
+            console.warn('[scheduler] ctx.gateManager not configured — gates will not be persisted');
             return 'gate-missing-manager';
+        }
         const scope = inferGateScope(node);
         const primaryAction = pickPrimaryAction(node, ctx.pluginRegistry);
         const gate = await ctx.gateManager.request(scope, {

package/lib/runtime/verification/verification-compiler.js CHANGED Viewed

@@ -92,15 +92,17 @@ async function runCheck(check, cwd, timeoutMs = 60000) {
     }
     const start = Date.now();
     try {
-        // Split command into program + args (simple split; no shell expansion)
-        const parts = check.command.split(/\s+/);
-        const prog = parts[0];
-        const args = parts.slice(1);
-        const result = (0, child_process_1.spawnSync)(prog, args, {
+        // Use shell so the full command string is interpreted (handles quotes, &&, node -e "...")
+        const isWin = process.platform === 'win32';
+        const shell = isWin ? 'cmd' : 'sh';
+        const shellArgs = isWin ? ['/c', check.command] : ['-c', check.command];
+        const result = (0, child_process_1.spawnSync)(shell, shellArgs, {
             cwd,
             encoding: 'utf8',
             timeout: timeoutMs,
             maxBuffer: 2 * 1024 * 1024,
+            // On Windows, prevent Node from re-quoting the args (preserves double-quotes inside node -e "...")
+            windowsVerbatimArguments: isWin,
         });
         const duration_ms = Date.now() - start;
         const status = result.status === 0 ? 'pass' : 'fail';

package/lib/sdk/index.cjs CHANGED Viewed

@@ -17,10 +17,10 @@ const plugins = require('../../bin/lib/oxe-plugins.cjs');
 const dashboard = require('../../bin/lib/oxe-dashboard.cjs');
 const operational = require('../../bin/lib/oxe-operational.cjs');
 const azure = require('../../bin/lib/oxe-azure.cjs');
-const context = require('../../bin/lib/oxe-context-engine.cjs');
-const runtimeSemantics = require('../../bin/lib/oxe-runtime-semantics.cjs');
-const release = require('../../bin/lib/oxe-release.cjs');
-const rationality = require('../../bin/lib/oxe-rationality.cjs');
+const context = require('../../bin/lib/oxe-context-engine.cjs');
+const runtimeSemantics = require('../../bin/lib/oxe-runtime-semantics.cjs');
+const release = require('../../bin/lib/oxe-release.cjs');
+const rationality = require('../../bin/lib/oxe-rationality.cjs');
 const PACKAGE_ROOT = path.join(__dirname, '..', '..');
@@ -94,8 +94,12 @@ function parsePlan(planMd) {
       ? filesMatch[1].match(/`([^`]+)`/g)?.map((s) => s.replace(/`/g, '')) || []
       : [];
-    const verifyCmdMatch = rest.match(/Comando:\s*`([^`]+)`/i);
-    const verifyCommand = verifyCmdMatch ? verifyCmdMatch[1] : null;
+    // Accept: "Comando: `...`" (PT), "**Verify command:** `...`", "**Verificação:** `...`", "**Verification:** `...`"
+    // Use [^`]+ with dotAll so multiline commands inside backticks are captured
+    const verifyCmdMatch = rest.match(
+      /(?:Comando|Verify\s+command|Verificação|Verification):\s*`([^`]+)`/is
+    );
+    const verifyCommand = verifyCmdMatch ? verifyCmdMatch[1].trim() : null;
     const aceiteMatch = rest.match(/\*\*Aceite\s+vinculado:\*\*\s*([^\n]+)/i);
     const aceite = aceiteMatch
@@ -542,23 +546,23 @@ module.exports = {
   /** Parsing de artefatos OXE (PLAN, SPEC, STATE, hypotheses, confidence, lessons). */
   parsePlan,
   parseSpec,
-  parseHypotheses: context.parseHypotheses,
-  parseConfidenceVector: context.parseConfidenceVector,
-  parseExecutionPlanTasks: rationality.parsePlanTasks,
-  parseState,
+  parseHypotheses: context.parseHypotheses,
+  parseConfidenceVector: context.parseConfidenceVector,
+  parseExecutionPlanTasks: rationality.parsePlanTasks,
+  parseState,
   validateDecisionFidelity,
   parseLessonsMetrics,
   updateLessonMetric,
   deprecateLowEffectiveness,
   /** Estado do projeto, SPEC/PLAN, fase, config. */
-  health: {
-    loadOxeConfigMerged: health.loadOxeConfigMerged,
-    validateConfigShape: health.validateConfigShape,
-    buildHealthReport: health.buildHealthReport,
-    detectWorkspaceMode: health.detectWorkspaceMode,
-    shouldSuppressExecutionWorkspaceGates: health.shouldSuppressExecutionWorkspaceGates,
-    suggestNextStep: health.suggestNextStep,
+  health: {
+    loadOxeConfigMerged: health.loadOxeConfigMerged,
+    validateConfigShape: health.validateConfigShape,
+    buildHealthReport: health.buildHealthReport,
+    detectWorkspaceMode: health.detectWorkspaceMode,
+    shouldSuppressExecutionWorkspaceGates: health.shouldSuppressExecutionWorkspaceGates,
+    suggestNextStep: health.suggestNextStep,
     oxePaths: health.oxePaths,
     parseStatePhase: health.parseStatePhase,
     parseLastScanDate: health.parseLastScanDate,
@@ -572,11 +576,11 @@ module.exports = {
     planAgentsWarnings: health.planAgentsWarnings,
     phaseCoherenceWarnings: health.phaseCoherenceWarnings,
     specSectionWarnings: health.specSectionWarnings,
-    planWaveWarningsFixed: health.planWaveWarningsFixed,
-    planTaskAceiteWarnings: health.planTaskAceiteWarnings,
-    buildExecutionRationality: health.buildExecutionRationality,
-    executionRationalityWarningsFromSummary: health.executionRationalityWarningsFromSummary,
-    verifyGapsWithoutSummaryWarning: health.verifyGapsWithoutSummaryWarning,
+    planWaveWarningsFixed: health.planWaveWarningsFixed,
+    planTaskAceiteWarnings: health.planTaskAceiteWarnings,
+    buildExecutionRationality: health.buildExecutionRationality,
+    executionRationalityWarningsFromSummary: health.executionRationalityWarningsFromSummary,
+    verifyGapsWithoutSummaryWarning: health.verifyGapsWithoutSummaryWarning,
     expandExecutionProfile: health.expandExecutionProfile,
     ALLOWED_CONFIG_KEYS: health.ALLOWED_CONFIG_KEYS,
     EXECUTION_PROFILES: health.EXECUTION_PROFILES,
@@ -643,28 +647,28 @@ module.exports = {
   },
   /** Dashboard local: contexto consolidado e persistência de revisão do plano. */
-  dashboard: {
-    loadDashboardContext: dashboard.loadDashboardContext,
-    savePlanReviewStatus: dashboard.savePlanReviewStatus,
-    addPlanReviewComment: dashboard.addPlanReviewComment,
-    updatePlanReviewCommentStatus: dashboard.updatePlanReviewCommentStatus,
-  },
-  /** Release readiness: manifest, smoke matrix e checks de consistência antes de publicar. */
-  release: {
-    REQUIRED_RUNTIMES: release.REQUIRED_RUNTIMES,
-    WRAPPER_TARGETS: release.WRAPPER_TARGETS,
-    releasePaths: release.releasePaths,
-    collectWrapperHashes: release.collectWrapperHashes,
-    loadRuntimeSmokeReport: release.loadRuntimeSmokeReport,
-    loadRecoveryFixtureReport: release.loadRecoveryFixtureReport,
-    loadMultiAgentSoakReport: release.loadMultiAgentSoakReport,
-    buildReleaseManifest: release.buildReleaseManifest,
-    inspectCanonicalSource: release.inspectCanonicalSource,
-    evaluateReleaseManifest: release.evaluateReleaseManifest,
-    inspectReleaseReadiness: release.inspectReleaseReadiness,
-    checkReleaseConsistency: release.checkReleaseConsistency,
-  },
+  dashboard: {
+    loadDashboardContext: dashboard.loadDashboardContext,
+    savePlanReviewStatus: dashboard.savePlanReviewStatus,
+    addPlanReviewComment: dashboard.addPlanReviewComment,
+    updatePlanReviewCommentStatus: dashboard.updatePlanReviewCommentStatus,
+  },
+  /** Release readiness: manifest, smoke matrix e checks de consistência antes de publicar. */
+  release: {
+    REQUIRED_RUNTIMES: release.REQUIRED_RUNTIMES,
+    WRAPPER_TARGETS: release.WRAPPER_TARGETS,
+    releasePaths: release.releasePaths,
+    collectWrapperHashes: release.collectWrapperHashes,
+    loadRuntimeSmokeReport: release.loadRuntimeSmokeReport,
+    loadRecoveryFixtureReport: release.loadRecoveryFixtureReport,
+    loadMultiAgentSoakReport: release.loadMultiAgentSoakReport,
+    buildReleaseManifest: release.buildReleaseManifest,
+    inspectCanonicalSource: release.inspectCanonicalSource,
+    evaluateReleaseManifest: release.evaluateReleaseManifest,
+    inspectReleaseReadiness: release.inspectReleaseReadiness,
+    checkReleaseConsistency: release.checkReleaseConsistency,
+  },
   /** Runtime operacional: tracing, active run, catálogo de capabilities e memória em camadas. */
   operational: {

package/oxe/templates/PLAN.template.md CHANGED Viewed

@@ -24,12 +24,14 @@ evidence_expectation: manifest | command | manual | mixed
 > Gerado a partir de `.oxe/SPEC.md`. Cada tarefa deve ter bloco **Verificar**.
-## Resumo
-- **Spec vinculada:** (data ou versão informal)
-- **Ondas:** (número)
-- **Tarefas:** (número)
-- **Artefatos racionais:** `IMPLEMENTATION-PACK`, `REFERENCE-ANCHORS`, `FIXTURE-PACK`
+## Resumo
+- **Spec vinculada:** (data ou versão informal)
+- **Ondas:** (número)
+- **Tarefas:** (número)
+- **Artefatos racionais:** `IMPLEMENTATION-PACK`, `REFERENCE-ANCHORS`, `FIXTURE-PACK`
+- **Público / outcome da spec:** …
+- **Padrão de validação dominante:** testes | smoke | manual guiado | mixed
 ## Autoavaliação do Plano
@@ -48,6 +50,7 @@ evidence_expectation: manifest | command | manual | mixed
 - **Alternativas descartadas:** (1–2 linhas)
 - **Condição para replanejar:** (critério objetivo)
 - **Bloqueadores de execução:** nenhum | listar gaps críticos
+- **Densidade operacional mínima confirmada:** paths | symbols | fixtures | anchors | checks
 <confidence_vector cycle="C-NN" generated_at="YYYY-MM-DDTHH:MM:SSZ">
   <dim name="requirements"   score="0.92" weight="25" note="completude dos requisitos" />
@@ -80,9 +83,17 @@ evidence_expectation: manifest | command | manual | mixed
 </hypothesis>
 -->
-## Dependências globais
-- (ex.: branch base, feature flags, migrations)
+## Dependências globais
+- (ex.: branch base, feature flags, migrations)
+## Contrato operacional da solução
+- **Write-set principal:** módulos/paths que concentram a mutação
+- **Modelo de conteúdo / dados a materializar:** …
+- **Interações ou fluxos obrigatórios:** …
+- **Persistência local/remota:** none | localStorage | API | outro
+- **Responsividade / acessibilidade obrigatória:** …
 ## Artefatos racionais de execução
@@ -118,18 +129,21 @@ evidence_expectation: manifest | command | manual | mixed
 ### T1 — (título)
 - **Arquivos alvo:** `src/exato.ts`
+- **Símbolos alvo:** `função`, `classe`, `componente`, `builder`, `schema`
 - **Depende de:** —
 - **Onda:** 1
 - **Complexidade:** S
 - **Risco:** low | medium | high | critical
 - **Evidência de entrada:** SPEC A1 | DISCUSS D-01 | RESEARCH RA-01 | codebase path
 - **Checkpoint:** nenhum | CHK-01
+- **Estado/fluxo coberto:** loading | empty | success | error | interação X
 - **Verificar:**
   - Comando: `…`
   - Manual: (opcional) …
 - **Implementar:** o mínimo para fazer a verificação acima passar.
 - **Aceite vinculado:** A1, A2 (IDs da tabela de critérios em SPEC.md)
 - **Contrato racional:** ver `IMPLEMENTATION-PACK.json` (task `T1`)
+- **Fixture/anchor obrigatório:** FX-01 | RA-01 | not_applicable
 - **Rollback/contensão:** obrigatório para risco high/critical; `not_applicable` se low/medium.
 ---

package/oxe/templates/SPEC.template.md CHANGED Viewed

@@ -15,16 +15,31 @@ inputs: []
 > Substitua os placeholders. Remova seções vazias se não se aplicarem.
-## Objetivo
-(Uma frase: o que entregar.)
-## Contexto
-- Repositório / produto: …
-- Links úteis: …
-- Tipo de demanda: feature | bugfix | refactor | research | ops | mixed
-- Incertezas estruturadas: …
+## Objetivo
+(Uma frase: o que entregar.)
+## Outcome esperado
+- Usuário ou operador principal: …
+- Resultado observável ao final da entrega: …
+- Medida de sucesso principal: …
+## Contexto
+- Repositório / produto: …
+- Links úteis: …
+- Tipo de demanda: feature | bugfix | refactor | research | ops | mixed
+- Incertezas estruturadas: …
+- Restrições técnicas obrigatórias: …
+- Tecnologias proibidas ou evitadas: …
+## Público e experiência
+- Público-alvo primário: …
+- Nível de conhecimento esperado: iniciante | intermediário | avançado
+- Contexto de uso: desktop | mobile | ambos | CLI | backoffice | batch
+- Tom ou padrão de experiência esperado: …
 ## Escopo
@@ -36,26 +51,44 @@ inputs: []
 - …
-## Critérios de aceite
-Use **IDs estáveis** (A1, A2, …) para o plano e o verify vincularem cada tarefa a um critério. Cada critério deve ser **testável ou observável** (comando, checklist ou critério objetivo).
+## Critérios de aceite
+Use **IDs estáveis** (A1, A2, …) para o plano e o verify vincularem cada tarefa a um critério. Cada critério deve ser **testável ou observável** (comando, checklist ou critério objetivo).
 | ID | Critério | Como verificar |
 |----|----------|----------------|
-| A1 | (ex.: Dado … quando … então …) | (ex.: `npm test`, teste manual X) |
-| A2 | … | … |
-## Suposições
-- …
+| A1 | (ex.: Dado … quando … então …) | (ex.: `npm test`, teste manual X) |
+| A2 | … | … |
+## Setup externo e pré-condições
+- Contas, variáveis de ambiente, filas, bancos, VPN, dashboards ou recursos cloud necessários: …
+- Pré-condições bloqueantes para executar ou validar: …
+## Conteúdo e fluxos obrigatórios
+- Fluxos obrigatórios da v1: …
+- Estados obrigatórios: loading | empty | error | success | disabled | not_applicable
+- Conteúdo mínimo obrigatório por área/módulo: …
+- Exemplos concretos que devem existir na entrega: …
+## Suposições
+- …
 ## Riscos
 - …
-## Referências no código
-- Caminhos / módulos: …
+## Referências no código
+- Caminhos / módulos: …
+## Contratos esperados para o plano
+- Arquivos ou áreas que o plano deverá fechar com write-set explícito: …
+- Fixtures, anchors ou exemplos locais obrigatórios antes de executar: …
+- Decisões que não podem ser deixadas para o executor: …
 ---

package/oxe/workflows/plan.md CHANGED Viewed

@@ -48,11 +48,16 @@ Fixtures mínimos por fluxo/tarefa de risco:
 - queries/checks de validação e smoke commands.
 - negative cases mínimos para validação de erro, limite ou regressão principal.
-Regra de readiness:
-- `IMPLEMENTATION-PACK` precisa estar `ready`;
-- `REFERENCE-ANCHORS` não pode ter âncora crítica em `missing|stale|conflicting`;
-- `FIXTURE-PACK` é obrigatório para tarefas mutáveis com parser/layout/integração/transformação/fila/migração/builder;
-- qualquer `critical_gap` aberto derruba a prontidão executável do plano.
+Regra de readiness:
+- `IMPLEMENTATION-PACK` precisa estar `ready`;
+- `REFERENCE-ANCHORS` não pode ter âncora crítica em `missing|stale|conflicting`;
+- `FIXTURE-PACK` é obrigatório para tarefas mutáveis com parser/layout/integração/transformação/fila/migração/builder;
+- qualquer `critical_gap` aberto derruba a prontidão executável do plano.
+**Contrato adicional para app/UI estático:** quando a trilha for página HTML/CSS/JS, dashboard, microsite, app sem framework ou experiência educacional:
+- o `IMPLEMENTATION-PACK` deve fechar seções obrigatórias da interface, comportamento por interação, estado persistido e modelo de conteúdo;
+- o `REFERENCE-ANCHORS` deve apontar para snippets, predecessores ou contratos locais/materializados que reduzam improviso visual e estrutural;
+- o `FIXTURE-PACK` deve incluir ao menos exemplos de conteúdo, estados da interface e checks de responsividade/console limpo quando a UI for parte central do aceite.
 </execution_rational_artifacts>
 <plan_iteration_contract>
@@ -177,7 +182,14 @@ Depois do resumo e antes das tarefas, o `PLAN.md` deve conter também:
 **Princípio test-first:** escreva o `Verificar` antes de escrever o `Implementar`. A pergunta é: "Como saberei que está pronto?" — a resposta define o target; `Implementar` é o caminho mínimo até esse target.
-**Contrato racional por tarefa:** se a tarefa for mutável ou tecnicamente relevante, o `PLAN.md` sozinho não basta. O `IMPLEMENTATION-PACK` deve fechar o write-set, os symbols e os checks; o `REFERENCE-ANCHORS` deve materializar evidência externa; o `FIXTURE-PACK` deve reduzir improviso em parsing/integração/transformação.
+**Contrato racional por tarefa:** se a tarefa for mutável ou tecnicamente relevante, o `PLAN.md` sozinho não basta. O `IMPLEMENTATION-PACK` deve fechar o write-set, os symbols e os checks; o `REFERENCE-ANCHORS` deve materializar evidência externa; o `FIXTURE-PACK` deve reduzir improviso em parsing/integração/transformação.
+**Contrato racional de densidade operacional:** plano com tarefa mutável ainda vaga (`...`, "ajustar onde necessário", "melhorar interface", "organizar conteúdo") não sustenta `Confiança > 90%`. Para passar do gate, o plano precisa fechar:
+- arquivos alvo exatos ou padrão restrito;
+- symbols/estruturas esperadas;
+- sequência mínima de implementação;
+- verificação observável por tarefa;
+- fixture ou anchor quando o risco for de UI, integração, parsing, contrato ou transformação.
 **Projetos sem suíte de testes única (legado):** o bloco **Verificar** pode usar `Comando: —` e **Manual** com Grep, leitura de paths ou checklist — ver exemplos em **`oxe/workflows/references/legacy-brownfield.md`**. Todo critério **A*** da SPEC deve aparecer em **Aceite vinculado** de alguma tarefa ou como gap explícito.

package/oxe/workflows/spec.md CHANGED Viewed

@@ -30,9 +30,24 @@ Se **`.oxe/config.json`** tiver `discuss_before_plan: true`: mencionar no final
 **Discovery adaptativo:** antes da primeira pergunta, aplicar `oxe/workflows/references/adaptive-discovery.md`. Classificar a demanda, modular os blocos de perguntas conforme o domínio, limitar rodadas e consolidar incertezas estruturadas que depois alimentarão a confiança do plano.
-**Rastreabilidade forte:** todo requisito `R-ID` precisa apontar para pelo menos um critério `A*` verificável, ou aparecer como v2/fora com justificativa. Critério sem método de verificação não entra como v1.
-**Setup externo:** quando o sucesso depender de conta, variável de ambiente, dashboard, fila, banco, credencial, VPN ou recurso cloud, registrar em SPEC a seção **Setup externo e pré-condições**. O plano deve transformar isso em checkpoint ou tarefa explícita; não deixar como suposição solta.
+**Rastreabilidade forte:** todo requisito `R-ID` precisa apontar para pelo menos um critério `A*` verificável, ou aparecer como v2/fora com justificativa. Critério sem método de verificação não entra como v1.
+**Setup externo:** quando o sucesso depender de conta, variável de ambiente, dashboard, fila, banco, credencial, VPN ou recurso cloud, registrar em SPEC a seção **Setup externo e pré-condições**. O plano deve transformar isso em checkpoint ou tarefa explícita; não deixar como suposição solta.
+**Contrato de indução da SPEC:** a SPEC deve sair forte o suficiente para que o usuário não precise compensar lacunas "no braço" durante o PLAN. Sempre extrair ou materializar explicitamente:
+- público-alvo primário;
+- outcome esperado observável;
+- restrições técnicas obrigatórias e proibições relevantes;
+- fluxos obrigatórios da v1;
+- conteúdo mínimo exigido por área;
+- exemplos mínimos esperados quando o pedido tocar UI, app, material didático, integração ou contrato público.
+**Demandas de produto/app/UI:** quando o pedido for uma aplicação, página, dashboard, fluxo visual ou experiência educacional, a SPEC deve congelar antes do PLAN:
+- blocos obrigatórios da interface;
+- estados principais (`loading`, `empty`, `error`, `success` quando aplicável);
+- interações mínimas esperadas;
+- regras objetivas de responsividade e acessibilidade;
+- critérios de aceite verificáveis por comportamento visível, não só por intenção narrativa.
 **Resolução de sessão:** antes de ler ou escrever artefatos desta trilha, resolver `active_session` em `.oxe/STATE.md` conforme `oxe/workflows/references/session-path-resolution.md`. Com sessão ativa:
 - `SPEC.md`, `ROADMAP.md` e `DISCUSS.md` vivem em `.oxe/<active_session>/spec/`
@@ -183,7 +198,7 @@ Complemento adaptativo para a Fase 1. Quando o domínio for confirmado (via scan
 ---
-### Domínio: UI e Frontend
+### Domínio: UI e Frontend
 *Adicionar ao Bloco B quando o escopo toca interface de usuário:*
@@ -195,11 +210,18 @@ Complemento adaptativo para a Fase 1. Quando o domínio for confirmado (via scan
 - Há internacionalização (i18n) ou múltiplos idiomas a suportar?
 - Qual a estratégia de tratamento de erros visível ao usuário?
-*Critérios A* a sugerir:*
-- `A-N: Componente exibe loading state enquanto dados carregam`
-- `A-N: Erro de API exibe mensagem legível, não stack trace`
-- `A-N: Formulário desabilita submit enquanto request está em andamento`
-- `A-N: Todos os campos de formulário têm label associada (WCAG básico)`
+*Critérios A* a sugerir:*
+- `A-N: Componente exibe loading state enquanto dados carregam`
+- `A-N: Erro de API exibe mensagem legível, não stack trace`
+- `A-N: Formulário desabilita submit enquanto request está em andamento`
+- `A-N: Todos os campos de formulário têm label associada (WCAG básico)`
+*Para páginas estáticas, apps sem framework ou experiências didáticas, também perguntar:*
+- Quais blocos da página são obrigatórios acima da dobra e abaixo da dobra?
+- O conteúdo é mais exploratório, guiado passo a passo, ou ambos?
+- Quais interações precisam existir obrigatoriamente na v1?
+- O progresso do usuário precisa persistir entre reloads?
+- Há exemplos de conteúdo, visualização ou exercícios mínimos que a aplicação precisa materializar?
 ---