npm - @vibecheckai/cli - Versions diffs - 3.2.5 → 3.3.0 - Mend

@vibecheckai/cli 3.2.5 → 3.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (197) hide show

package/bin/.generated +25 -25
package/bin/dev/run-v2-torture.js +30 -30
package/bin/registry.js +192 -5
package/bin/runners/lib/__tests__/entitlements-v2.test.js +295 -295
package/bin/runners/lib/agent-firewall/change-packet/builder.js +280 -6
package/bin/runners/lib/agent-firewall/critic/index.js +151 -0
package/bin/runners/lib/agent-firewall/critic/judge.js +432 -0
package/bin/runners/lib/agent-firewall/critic/prompts.js +305 -0
package/bin/runners/lib/agent-firewall/lawbook/distributor.js +465 -0
package/bin/runners/lib/agent-firewall/lawbook/evaluator.js +604 -0
package/bin/runners/lib/agent-firewall/lawbook/index.js +304 -0
package/bin/runners/lib/agent-firewall/lawbook/registry.js +514 -0
package/bin/runners/lib/agent-firewall/lawbook/schema.js +420 -0
package/bin/runners/lib/agent-firewall/logger.js +141 -0
package/bin/runners/lib/agent-firewall/policy/loader.js +312 -4
package/bin/runners/lib/agent-firewall/policy/rules/ghost-env.js +113 -1
package/bin/runners/lib/agent-firewall/policy/rules/ghost-route.js +133 -6
package/bin/runners/lib/agent-firewall/proposal/extractor.js +394 -0
package/bin/runners/lib/agent-firewall/proposal/index.js +212 -0
package/bin/runners/lib/agent-firewall/proposal/schema.js +251 -0
package/bin/runners/lib/agent-firewall/proposal/validator.js +386 -0
package/bin/runners/lib/agent-firewall/reality/index.js +332 -0
package/bin/runners/lib/agent-firewall/reality/state.js +625 -0
package/bin/runners/lib/agent-firewall/reality/watcher.js +322 -0
package/bin/runners/lib/agent-firewall/risk/index.js +173 -0
package/bin/runners/lib/agent-firewall/risk/scorer.js +328 -0
package/bin/runners/lib/agent-firewall/risk/thresholds.js +321 -0
package/bin/runners/lib/agent-firewall/risk/vectors.js +421 -0
package/bin/runners/lib/agent-firewall/simulator/diff-simulator.js +472 -0
package/bin/runners/lib/agent-firewall/simulator/import-resolver.js +346 -0
package/bin/runners/lib/agent-firewall/simulator/index.js +181 -0
package/bin/runners/lib/agent-firewall/simulator/route-validator.js +380 -0
package/bin/runners/lib/agent-firewall/time-machine/incident-correlator.js +661 -0
package/bin/runners/lib/agent-firewall/time-machine/index.js +267 -0
package/bin/runners/lib/agent-firewall/time-machine/replay-engine.js +436 -0
package/bin/runners/lib/agent-firewall/time-machine/state-reconstructor.js +490 -0
package/bin/runners/lib/agent-firewall/time-machine/timeline-builder.js +530 -0
package/bin/runners/lib/analyzers.js +81 -18
package/bin/runners/lib/api-client.js +269 -0
package/bin/runners/lib/auth-truth.js +193 -193
package/bin/runners/lib/authority-badge.js +425 -0
package/bin/runners/lib/backup.js +62 -62
package/bin/runners/lib/billing.js +107 -107
package/bin/runners/lib/claims.js +118 -118
package/bin/runners/lib/cli-output.js +7 -1
package/bin/runners/lib/cli-ui.js +540 -540
package/bin/runners/lib/contracts/auth-contract.js +202 -202
package/bin/runners/lib/contracts/env-contract.js +181 -181
package/bin/runners/lib/contracts/external-contract.js +206 -206
package/bin/runners/lib/contracts/guard.js +168 -168
package/bin/runners/lib/contracts/index.js +89 -89
package/bin/runners/lib/contracts/plan-validator.js +311 -311
package/bin/runners/lib/contracts/route-contract.js +199 -199
package/bin/runners/lib/contracts.js +804 -804
package/bin/runners/lib/detect.js +89 -89
package/bin/runners/lib/doctor/autofix.js +254 -254
package/bin/runners/lib/doctor/index.js +37 -37
package/bin/runners/lib/doctor/modules/dependencies.js +325 -325
package/bin/runners/lib/doctor/modules/index.js +46 -46
package/bin/runners/lib/doctor/modules/network.js +250 -250
package/bin/runners/lib/doctor/modules/project.js +312 -312
package/bin/runners/lib/doctor/modules/runtime.js +224 -224
package/bin/runners/lib/doctor/modules/security.js +348 -348
package/bin/runners/lib/doctor/modules/system.js +213 -213
package/bin/runners/lib/doctor/modules/vibecheck.js +394 -394
package/bin/runners/lib/doctor/reporter.js +262 -262
package/bin/runners/lib/doctor/service.js +262 -262
package/bin/runners/lib/doctor/types.js +113 -113
package/bin/runners/lib/doctor/ui.js +263 -263
package/bin/runners/lib/doctor-v2.js +608 -608
package/bin/runners/lib/drift.js +425 -425
package/bin/runners/lib/enforcement.js +72 -72
package/bin/runners/lib/enterprise-detect.js +603 -603
package/bin/runners/lib/enterprise-init.js +942 -942
package/bin/runners/lib/env-resolver.js +417 -417
package/bin/runners/lib/env-template.js +66 -66
package/bin/runners/lib/env.js +189 -189
package/bin/runners/lib/error-handler.js +16 -9
package/bin/runners/lib/exit-codes.js +275 -0
package/bin/runners/lib/extractors/client-calls.js +990 -990
package/bin/runners/lib/extractors/fastify-route-dump.js +573 -573
package/bin/runners/lib/extractors/fastify-routes.js +426 -426
package/bin/runners/lib/extractors/index.js +363 -363
package/bin/runners/lib/extractors/next-routes.js +524 -524
package/bin/runners/lib/extractors/proof-graph.js +431 -431
package/bin/runners/lib/extractors/route-matcher.js +451 -451
package/bin/runners/lib/extractors/truthpack-v2.js +377 -377
package/bin/runners/lib/extractors/ui-bindings.js +547 -547
package/bin/runners/lib/findings-schema.js +281 -281
package/bin/runners/lib/firewall-prompt.js +50 -50
package/bin/runners/lib/global-flags.js +37 -0
package/bin/runners/lib/graph/graph-builder.js +265 -265
package/bin/runners/lib/graph/html-renderer.js +413 -413
package/bin/runners/lib/graph/index.js +32 -32
package/bin/runners/lib/graph/runtime-collector.js +215 -215
package/bin/runners/lib/graph/static-extractor.js +518 -518
package/bin/runners/lib/help-formatter.js +413 -0
package/bin/runners/lib/html-report.js +650 -650
package/bin/runners/lib/llm.js +75 -75
package/bin/runners/lib/logger.js +38 -0
package/bin/runners/lib/meter.js +61 -61
package/bin/runners/lib/missions/evidence.js +126 -126
package/bin/runners/lib/patch.js +40 -40
package/bin/runners/lib/permissions/auth-model.js +213 -213
package/bin/runners/lib/permissions/idor-prover.js +205 -205
package/bin/runners/lib/permissions/index.js +45 -45
package/bin/runners/lib/permissions/matrix-builder.js +198 -198
package/bin/runners/lib/pkgjson.js +28 -28
package/bin/runners/lib/policy.js +295 -295
package/bin/runners/lib/preflight.js +142 -142
package/bin/runners/lib/reality/correlation-detectors.js +359 -359
package/bin/runners/lib/reality/index.js +318 -318
package/bin/runners/lib/reality/request-hashing.js +416 -416
package/bin/runners/lib/reality/request-mapper.js +453 -453
package/bin/runners/lib/reality/safety-rails.js +463 -463
package/bin/runners/lib/reality/semantic-snapshot.js +408 -408
package/bin/runners/lib/reality/toast-detector.js +393 -393
package/bin/runners/lib/reality-findings.js +84 -84
package/bin/runners/lib/receipts.js +179 -179
package/bin/runners/lib/redact.js +29 -29
package/bin/runners/lib/replay/capsule-manager.js +154 -154
package/bin/runners/lib/replay/index.js +263 -263
package/bin/runners/lib/replay/player.js +348 -348
package/bin/runners/lib/replay/recorder.js +331 -331
package/bin/runners/lib/report.js +135 -135
package/bin/runners/lib/route-detection.js +1140 -1140
package/bin/runners/lib/sandbox/index.js +59 -59
package/bin/runners/lib/sandbox/proof-chain.js +399 -399
package/bin/runners/lib/sandbox/sandbox-runner.js +205 -205
package/bin/runners/lib/sandbox/worktree.js +174 -174
package/bin/runners/lib/schema-validator.js +350 -350
package/bin/runners/lib/schemas/contracts.schema.json +160 -160
package/bin/runners/lib/schemas/finding.schema.json +100 -100
package/bin/runners/lib/schemas/mission-pack.schema.json +206 -206
package/bin/runners/lib/schemas/proof-graph.schema.json +176 -176
package/bin/runners/lib/schemas/reality-report.schema.json +162 -162
package/bin/runners/lib/schemas/share-pack.schema.json +180 -180
package/bin/runners/lib/schemas/ship-report.schema.json +117 -117
package/bin/runners/lib/schemas/truthpack-v2.schema.json +303 -303
package/bin/runners/lib/schemas/validator.js +438 -438
package/bin/runners/lib/score-history.js +282 -282
package/bin/runners/lib/share-pack.js +239 -239
package/bin/runners/lib/snippets.js +67 -67
package/bin/runners/lib/unified-cli-output.js +604 -0
package/bin/runners/lib/upsell.js +658 -510
package/bin/runners/lib/usage.js +153 -153
package/bin/runners/lib/validate-patch.js +156 -156
package/bin/runners/lib/verdict-engine.js +628 -628
package/bin/runners/reality/engine.js +917 -917
package/bin/runners/reality/flows.js +122 -122
package/bin/runners/reality/report.js +378 -378
package/bin/runners/reality/session.js +193 -193
package/bin/runners/runAgent.d.ts +5 -0
package/bin/runners/runApprove.js +1200 -0
package/bin/runners/runAuth.js +324 -95
package/bin/runners/runCheckpoint.js +39 -21
package/bin/runners/runClassify.js +859 -0
package/bin/runners/runContext.js +136 -24
package/bin/runners/runDoctor.js +108 -68
package/bin/runners/runFirewall.d.ts +5 -0
package/bin/runners/runFirewallHook.d.ts +5 -0
package/bin/runners/runFix.js +6 -5
package/bin/runners/runGuard.js +262 -168
package/bin/runners/runInit.js +3 -2
package/bin/runners/runMcp.js +130 -52
package/bin/runners/runPolish.js +43 -20
package/bin/runners/runProve.js +1 -2
package/bin/runners/runReport.js +3 -2
package/bin/runners/runScan.js +145 -44
package/bin/runners/runShip.js +3 -4
package/bin/runners/runTruth.d.ts +5 -0
package/bin/runners/runValidate.js +19 -2
package/bin/runners/runWatch.js +104 -53
package/bin/vibecheck.js +106 -19
package/mcp-server/HARDENING_SUMMARY.md +299 -0
package/mcp-server/agent-firewall-interceptor.js +367 -31
package/mcp-server/authority-tools.js +569 -0
package/mcp-server/conductor/conflict-resolver.js +588 -0
package/mcp-server/conductor/execution-planner.js +544 -0
package/mcp-server/conductor/index.js +377 -0
package/mcp-server/conductor/lock-manager.js +615 -0
package/mcp-server/conductor/request-queue.js +550 -0
package/mcp-server/conductor/session-manager.js +500 -0
package/mcp-server/conductor/tools.js +510 -0
package/mcp-server/index.js +1199 -208
package/mcp-server/lib/api-client.cjs +305 -0
package/mcp-server/lib/logger.cjs +30 -0
package/mcp-server/logger.js +173 -0
package/mcp-server/package.json +2 -2
package/mcp-server/premium-tools.js +2 -2
package/mcp-server/tier-auth.js +351 -136
package/mcp-server/tools/index.js +72 -72
package/mcp-server/truth-firewall-tools.js +145 -15
package/mcp-server/vibecheck-tools.js +2 -2
package/package.json +2 -3
package/mcp-server/index.old.js +0 -4137
package/mcp-server/package-lock.json +0 -165

package/bin/runners/lib/agent-firewall/change-packet/builder.js CHANGED Viewed

@@ -3,6 +3,12 @@
  *
  * Builds change packets from diffs + agent intent.
  * Each packet is a complete audit artifact of an AI code change attempt.
+ *
+ * Enhanced with:
+ * - Risk scoring
+ * - Simulation results
+ * - Critic verdict
+ * - Override tracking
  */
 "use strict";
@@ -10,6 +16,22 @@
 const crypto = require("crypto");
 const path = require("path");
+/**
+ * @typedef {Object} ProofArtifact
+ * @property {string} changeId - Unique change identifier
+ * @property {string} decision - ALLOW, BLOCK, or REQUIRE_CONFIRMATION
+ * @property {Array} rulesTriggered - Rules that were triggered
+ * @property {Array} assumptionsFailed - Failed assumptions
+ * @property {number} riskScore - Numerical risk score
+ * @property {string} riskLevel - LOW, MEDIUM, HIGH, CRITICAL
+ * @property {Object} simulationResult - Result of diff simulation
+ * @property {Object} criticVerdict - Critic LLM verdict
+ * @property {string} timestamp - ISO timestamp
+ * @property {boolean} overrideUsed - Whether override was used
+ * @property {string} overrideBy - Who overrode (if applicable)
+ * @property {string} overrideReason - Reason for override
+ */
 /**
  * Build a change packet from diff and agent intent
  * @param {object} params
@@ -22,6 +44,11 @@ const path = require("path");
  * @param {object} params.verdict - Policy verdict
  * @param {object} params.unblockPlan - Unblock plan (if blocked)
  * @param {object} params.policy - Policy used for evaluation
+ * @param {object} params.riskScore - Risk scoring result
+ * @param {object} params.simulationResult - Diff simulation result
+ * @param {object} params.criticVerdict - Critic LLM verdict
+ * @param {object} params.proposal - Structured change proposal
+ * @param {object} params.override - Override information
  * @returns {object} Change packet
  */
 function buildChangePacket({
@@ -33,7 +60,12 @@ function buildChangePacket({
   evidence = [],
   verdict,
   unblockPlan = null,
-  policy = null
+  policy = null,
+  riskScore = null,
+  simulationResult = null,
+  criticVerdict = null,
+  proposal = null,
+  override = null
 }) {
   const timestamp = new Date().toISOString();
@@ -61,27 +93,83 @@ function buildChangePacket({
     domain: classifyFileDomain(filePath)
   }];
-  // Build packet
+  // Extract failed assumptions from evidence
+  const assumptionsFailed = evidence
+    .filter(e => e.status === "UNPROVEN" || !e.verified)
+    .map(e => e.claim?.key || e.claim?.type || e.assumption || "unknown");
+  // Extract triggered rules from verdict
+  const rulesTriggered = (verdict?.violations || [])
+    .map(v => v.rule || v.type || v.id)
+    .filter(Boolean);
+  // Build packet with enhanced proof artifact fields
   const packet = {
     id,
     timestamp,
     agentId,
     intent: intent || "No intent provided",
+    // Original fields
     diff: diff || null,
     files,
     claims,
     evidence,
+    // Verdict and decision
     verdict: verdict || {
       decision: "ALLOW",
       violations: [],
       message: "No verdict provided"
     },
     unblockPlan: unblockPlan || null,
+    // Enhanced proof artifact fields
+    proof: {
+      changeId: `c-${id}`,
+      decision: verdict?.decision || "ALLOW",
+      rulesTriggered,
+      assumptionsFailed,
+      riskScore: riskScore?.total ?? null,
+      riskLevel: riskScore?.level || null,
+      riskFactors: riskScore?.reasons || [],
+      simulationResult: simulationResult ? {
+        passed: simulationResult.passed,
+        errorCount: simulationResult.errors?.length || 0,
+        warningCount: simulationResult.warnings?.length || 0,
+        errors: (simulationResult.errors || []).slice(0, 5).map(e => e.message || e),
+        warnings: (simulationResult.warnings || []).slice(0, 5).map(w => w.message || w),
+      } : null,
+      criticVerdict: criticVerdict ? {
+        verdict: criticVerdict.verdict,
+        confidence: criticVerdict.confidence,
+        reasoning: criticVerdict.reasoning || [],
+        violations: criticVerdict.violations || [],
+      } : null,
+      overrideUsed: override?.used || false,
+      overrideBy: override?.by || null,
+      overrideReason: override?.reason || null,
+      overrideTimestamp: override?.timestamp || null,
+    },
+    // Structured proposal (if provided)
+    proposal: proposal ? {
+      intent: proposal.intent,
+      summary: proposal.summary,
+      confidence: proposal.confidence,
+      assumptions: proposal.assumptions,
+      filesTouched: proposal.filesTouched,
+      operationCount: proposal.operations?.length || 0,
+    } : null,
+    // Metadata
     metadata: {
       totalFiles: files.length,
       totalLines: linesChanged,
       policyVersion: policy?.version || "unknown",
-      policyProfile: policy?.profile || "unknown"
+      policyProfile: policy?.profile || "unknown",
+      policyMode: policy?.mode || "unknown",
+      domains: [...new Set(files.map(f => f.domain))],
     }
   };
@@ -98,6 +186,11 @@ function buildChangePacket({
  * @param {object} params.verdict - Policy verdict
  * @param {object} params.unblockPlan - Unblock plan (if blocked)
  * @param {object} params.policy - Policy used for evaluation
+ * @param {object} params.riskScore - Risk scoring result
+ * @param {object} params.simulationResult - Diff simulation result
+ * @param {object} params.criticVerdict - Critic LLM verdict
+ * @param {object} params.proposal - Structured change proposal
+ * @param {object} params.override - Override information
  * @returns {object} Change packet
  */
 function buildMultiFileChangePacket({
@@ -107,7 +200,12 @@ function buildMultiFileChangePacket({
   evidence = [],
   verdict,
   unblockPlan = null,
-  policy = null
+  policy = null,
+  riskScore = null,
+  simulationResult = null,
+  criticVerdict = null,
+  proposal = null,
+  override = null
 }) {
   const timestamp = new Date().toISOString();
@@ -148,30 +246,86 @@ function buildMultiFileChangePacket({
     .filter(Boolean)
     .join("\n\n");
+  // Extract failed assumptions from evidence
+  const assumptionsFailed = evidence
+    .filter(e => e.status === "UNPROVEN" || !e.verified)
+    .map(e => e.claim?.key || e.claim?.type || e.assumption || "unknown");
+  // Extract triggered rules from verdict
+  const rulesTriggered = (verdict?.violations || [])
+    .map(v => v.rule || v.type || v.id)
+    .filter(Boolean);
   const packet = {
     id,
     timestamp,
     agentId,
     intent: intent || "No intent provided",
+    // Original fields
     diff: unifiedDiff ? {
       unified: unifiedDiff,
-      before: null, // Multi-file diffs don't store full before/after
+      before: null,
       after: null
     } : null,
     files,
     claims,
     evidence,
+    // Verdict and decision
     verdict: verdict || {
       decision: "ALLOW",
       violations: [],
       message: "No verdict provided"
     },
     unblockPlan: unblockPlan || null,
+    // Enhanced proof artifact fields
+    proof: {
+      changeId: `c-${id}`,
+      decision: verdict?.decision || "ALLOW",
+      rulesTriggered,
+      assumptionsFailed,
+      riskScore: riskScore?.total ?? null,
+      riskLevel: riskScore?.level || null,
+      riskFactors: riskScore?.reasons || [],
+      simulationResult: simulationResult ? {
+        passed: simulationResult.passed,
+        errorCount: simulationResult.errors?.length || 0,
+        warningCount: simulationResult.warnings?.length || 0,
+        errors: (simulationResult.errors || []).slice(0, 5).map(e => e.message || e),
+        warnings: (simulationResult.warnings || []).slice(0, 5).map(w => w.message || w),
+      } : null,
+      criticVerdict: criticVerdict ? {
+        verdict: criticVerdict.verdict,
+        confidence: criticVerdict.confidence,
+        reasoning: criticVerdict.reasoning || [],
+        violations: criticVerdict.violations || [],
+      } : null,
+      overrideUsed: override?.used || false,
+      overrideBy: override?.by || null,
+      overrideReason: override?.reason || null,
+      overrideTimestamp: override?.timestamp || null,
+    },
+    // Structured proposal (if provided)
+    proposal: proposal ? {
+      intent: proposal.intent,
+      summary: proposal.summary,
+      confidence: proposal.confidence,
+      assumptions: proposal.assumptions,
+      filesTouched: proposal.filesTouched,
+      operationCount: proposal.operations?.length || 0,
+    } : null,
+    // Metadata
     metadata: {
       totalFiles: files.length,
       totalLines: files.reduce((sum, f) => sum + f.linesChanged, 0),
       policyVersion: policy?.version || "unknown",
-      policyProfile: policy?.profile || "unknown"
+      policyProfile: policy?.profile || "unknown",
+      policyMode: policy?.mode || "unknown",
+      domains: [...new Set(files.map(f => f.domain))],
     }
   };
@@ -206,9 +360,129 @@ function classifyFileDomain(filePath) {
   return "general";
 }
+/**
+ * Build a standalone proof artifact for compliance
+ * @param {object} params - Proof parameters
+ * @returns {ProofArtifact} Proof artifact
+ */
+function buildProofArtifact({
+  changeId,
+  decision,
+  rulesTriggered = [],
+  assumptionsFailed = [],
+  riskScore = null,
+  simulationResult = null,
+  criticVerdict = null,
+  override = null,
+}) {
+  const timestamp = new Date().toISOString();
+  return {
+    changeId: changeId || `c-${crypto.randomBytes(8).toString("hex")}`,
+    decision: decision || "BLOCK",
+    rulesTriggered,
+    assumptionsFailed,
+    riskScore: riskScore?.total ?? null,
+    riskLevel: riskScore?.level || "UNKNOWN",
+    riskFactors: riskScore?.reasons || [],
+    simulationResult: simulationResult ? {
+      passed: simulationResult.passed,
+      errorCount: simulationResult.errors?.length || 0,
+      warningCount: simulationResult.warnings?.length || 0,
+      brokenImports: (simulationResult.errors || [])
+        .filter(e => e.type === "broken_import" || e.type === "unresolved_import")
+        .map(e => e.import),
+    } : null,
+    criticVerdict: criticVerdict ? {
+      verdict: criticVerdict.verdict,
+      confidence: criticVerdict.confidence,
+      reasoning: criticVerdict.reasoning || [],
+    } : null,
+    timestamp,
+    overrideUsed: override?.used || false,
+    overrideBy: override?.by || null,
+    overrideReason: override?.reason || null,
+  };
+}
+/**
+ * Extract proof artifact from a change packet
+ * @param {object} packet - Change packet
+ * @returns {ProofArtifact} Proof artifact
+ */
+function extractProofArtifact(packet) {
+  if (packet.proof) {
+    return {
+      ...packet.proof,
+      timestamp: packet.timestamp,
+    };
+  }
+  // Build from legacy packet format
+  return {
+    changeId: `c-${packet.id}`,
+    decision: packet.verdict?.decision || "UNKNOWN",
+    rulesTriggered: (packet.verdict?.violations || []).map(v => v.rule || v.type),
+    assumptionsFailed: packet.evidence
+      ?.filter(e => e.status === "UNPROVEN")
+      .map(e => e.claim?.key) || [],
+    riskScore: null,
+    riskLevel: "UNKNOWN",
+    simulationResult: null,
+    criticVerdict: null,
+    timestamp: packet.timestamp,
+    overrideUsed: false,
+    overrideBy: null,
+    overrideReason: null,
+  };
+}
+/**
+ * Format proof artifact for display
+ * @param {ProofArtifact} proof - Proof artifact
+ * @returns {string} Formatted string
+ */
+function formatProofArtifact(proof) {
+  const lines = [
+    `Change ID: ${proof.changeId}`,
+    `Decision: ${proof.decision}`,
+    `Timestamp: ${proof.timestamp}`,
+    "",
+  ];
+  if (proof.riskScore !== null) {
+    lines.push(`Risk Score: ${proof.riskScore} (${proof.riskLevel})`);
+  }
+  if (proof.rulesTriggered.length > 0) {
+    lines.push(`Rules Triggered: ${proof.rulesTriggered.join(", ")}`);
+  }
+  if (proof.assumptionsFailed.length > 0) {
+    lines.push(`Assumptions Failed: ${proof.assumptionsFailed.join(", ")}`);
+  }
+  if (proof.simulationResult) {
+    lines.push(`Simulation: ${proof.simulationResult.passed ? "PASSED" : "FAILED"} (${proof.simulationResult.errorCount} errors)`);
+  }
+  if (proof.criticVerdict) {
+    lines.push(`Critic: ${proof.criticVerdict.verdict} (${(proof.criticVerdict.confidence * 100).toFixed(0)}% confidence)`);
+  }
+  if (proof.overrideUsed) {
+    lines.push(`Override: Used by ${proof.overrideBy} - ${proof.overrideReason}`);
+  }
+  return lines.join("\n");
+}
 module.exports = {
   buildChangePacket,
   buildMultiFileChangePacket,
+  buildProofArtifact,
+  extractProofArtifact,
+  formatProofArtifact,
   calculateLinesChanged,
   classifyFileDomain
 };

package/bin/runners/lib/agent-firewall/critic/index.js ADDED Viewed

@@ -0,0 +1,151 @@
+/**
+ * Critic Module
+ *
+ * Entry point for the Critic LLM judge.
+ * The "savage" that evaluates proposal quality.
+ *
+ * Usage:
+ *   const { critic } = require('./critic');
+ *
+ *   // Configure with LLM client
+ *   critic.setClient(async (params) => {
+ *     return await callOpenAI(params);
+ *   });
+ *
+ *   // Evaluate a proposal
+ *   const verdict = await critic.evaluate({
+ *     proposal,
+ *     validationResults,
+ *     riskScore,
+ *     simulationResult,
+ *     realityState,
+ *   });
+ */
+"use strict";
+const {
+  CriticJudge,
+  createJudge,
+  defaultJudge,
+} = require("./judge");
+const {
+  CRITIC_SYSTEM_PROMPT,
+  EVALUATION_PROMPT_TEMPLATE,
+  VAGUENESS_CHECK_PROMPT,
+  ASSUMPTION_VERIFICATION_PROMPT,
+  buildEvaluationPrompt,
+  buildVaguenessPrompt,
+  buildVerificationPrompt,
+  parseCriticResponse,
+} = require("./prompts");
+/**
+ * Critic singleton interface
+ */
+const critic = {
+  /**
+   * Set the LLM client for the default judge
+   * @param {Function} client - LLM client function
+   */
+  setClient(client) {
+    defaultJudge.setClient(client);
+  },
+  /**
+   * Check if critic is available
+   * @returns {boolean} Is available
+   */
+  isAvailable() {
+    return defaultJudge.isAvailable();
+  },
+  /**
+   * Evaluate a proposal
+   * @param {Object} params - Evaluation parameters
+   * @returns {Promise<Object>} Critic verdict
+   */
+  async evaluate(params) {
+    return defaultJudge.evaluate(params);
+  },
+  /**
+   * Check for vagueness
+   * @param {Object} proposal - Proposal to check
+   * @returns {Promise<Object>} Vagueness analysis
+   */
+  async checkVagueness(proposal) {
+    return defaultJudge.checkVagueness(proposal);
+  },
+  /**
+   * Verify assumptions
+   * @param {Array} assumptions - Assumptions to verify
+   * @param {Object} realityState - Repository state
+   * @returns {Promise<Object>} Verification results
+   */
+  async verifyAssumptions(assumptions, realityState) {
+    return defaultJudge.verifyAssumptions(assumptions, realityState);
+  },
+  /**
+   * Create a new judge instance
+   * @param {Object} options - Configuration
+   * @returns {CriticJudge} New judge instance
+   */
+  createJudge(options) {
+    return createJudge(options);
+  },
+  /**
+   * Get the system prompt
+   * @returns {string} System prompt
+   */
+  getSystemPrompt() {
+    return CRITIC_SYSTEM_PROMPT;
+  },
+  /**
+   * Build an evaluation prompt
+   * @param {Object} data - Prompt data
+   * @returns {string} Filled prompt
+   */
+  buildPrompt(data) {
+    return buildEvaluationPrompt(data);
+  },
+  /**
+   * Parse a critic response
+   * @param {string} response - LLM response
+   * @returns {Object} Parsed verdict
+   */
+  parseResponse(response) {
+    return parseCriticResponse(response);
+  },
+  /**
+   * Quick rule-based evaluation (no LLM)
+   * @param {Object} params - Evaluation params
+   * @returns {Object} Verdict
+   */
+  quickEvaluate(params) {
+    return defaultJudge.ruleBasedEvaluation(params);
+  },
+};
+module.exports = {
+  critic,
+  CriticJudge,
+  createJudge,
+  defaultJudge,
+  // Prompt exports
+  CRITIC_SYSTEM_PROMPT,
+  EVALUATION_PROMPT_TEMPLATE,
+  VAGUENESS_CHECK_PROMPT,
+  ASSUMPTION_VERIFICATION_PROMPT,
+  buildEvaluationPrompt,
+  buildVaguenessPrompt,
+  buildVerificationPrompt,
+  parseCriticResponse,
+};