npm - @vibecheckai/cli - Versions diffs - 3.4.0 → 3.5.1 - Mend

@vibecheckai/cli 3.4.0 → 3.5.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (228) hide show

package/bin/registry.js +154 -338
package/bin/runners/context/generators/mcp.js +13 -15
package/bin/runners/context/proof-context.js +1 -248
package/bin/runners/lib/analysis-core.js +180 -198
package/bin/runners/lib/analyzers.js +223 -1669
package/bin/runners/lib/cli-output.js +210 -242
package/bin/runners/lib/detectors-v2.js +785 -547
package/bin/runners/lib/entitlements-v2.js +458 -96
package/bin/runners/lib/error-handler.js +9 -16
package/bin/runners/lib/global-flags.js +0 -37
package/bin/runners/lib/route-truth.js +322 -1167
package/bin/runners/lib/scan-output.js +469 -448
package/bin/runners/lib/ship-output.js +27 -280
package/bin/runners/lib/terminal-ui.js +733 -231
package/bin/runners/lib/truth.js +321 -1004
package/bin/runners/lib/unified-output.js +158 -162
package/bin/runners/lib/upsell.js +204 -104
package/bin/runners/runAllowlist.js +324 -0
package/bin/runners/runAuth.js +95 -324
package/bin/runners/runCheckpoint.js +21 -39
package/bin/runners/runContext.js +24 -136
package/bin/runners/runDoctor.js +67 -115
package/bin/runners/runEvidencePack.js +219 -0
package/bin/runners/runFix.js +5 -6
package/bin/runners/runGuard.js +118 -212
package/bin/runners/runInit.js +2 -14
package/bin/runners/runInstall.js +281 -0
package/bin/runners/runLabs.js +341 -0
package/bin/runners/runMcp.js +52 -130
package/bin/runners/runPolish.js +20 -43
package/bin/runners/runProve.js +3 -13
package/bin/runners/runReality.js +0 -14
package/bin/runners/runReport.js +2 -3
package/bin/runners/runScan.js +44 -511
package/bin/runners/runShip.js +14 -28
package/bin/runners/runValidate.js +2 -19
package/bin/runners/runWatch.js +54 -118
package/bin/vibecheck.js +41 -148
package/mcp-server/ARCHITECTURE.md +339 -0
package/mcp-server/__tests__/cache.test.ts +313 -0
package/mcp-server/__tests__/executor.test.ts +239 -0
package/mcp-server/__tests__/fixtures/exclusion-test/.cache/webpack/cache.pack +1 -0
package/mcp-server/__tests__/fixtures/exclusion-test/.next/server/chunk.js +3 -0
package/mcp-server/__tests__/fixtures/exclusion-test/.turbo/cache.json +3 -0
package/mcp-server/__tests__/fixtures/exclusion-test/.venv/lib/env.py +3 -0
package/mcp-server/__tests__/fixtures/exclusion-test/dist/bundle.js +3 -0
package/mcp-server/__tests__/fixtures/exclusion-test/package.json +5 -0
package/mcp-server/__tests__/fixtures/exclusion-test/src/app.ts +5 -0
package/mcp-server/__tests__/fixtures/exclusion-test/venv/lib/config.py +4 -0
package/mcp-server/__tests__/ids.test.ts +345 -0
package/mcp-server/__tests__/integration/tools.test.ts +410 -0
package/mcp-server/__tests__/registry.test.ts +365 -0
package/mcp-server/__tests__/sandbox.test.ts +323 -0
package/mcp-server/__tests__/schemas.test.ts +372 -0
package/mcp-server/benchmarks/run-benchmarks.ts +304 -0
package/mcp-server/examples/doctor.request.json +14 -0
package/mcp-server/examples/doctor.response.json +53 -0
package/mcp-server/examples/error.response.json +15 -0
package/mcp-server/examples/scan.request.json +14 -0
package/mcp-server/examples/scan.response.json +108 -0
package/mcp-server/handlers/tool-handler.ts +671 -0
package/mcp-server/index-v3.ts +293 -0
package/mcp-server/index.js +1072 -1573
package/mcp-server/index.old.js +4137 -0
package/mcp-server/lib/cache.ts +341 -0
package/mcp-server/lib/errors.ts +346 -0
package/mcp-server/lib/executor.ts +792 -0
package/mcp-server/lib/ids.ts +238 -0
package/mcp-server/lib/logger.ts +368 -0
package/mcp-server/lib/metrics.ts +365 -0
package/mcp-server/lib/sandbox.ts +337 -0
package/mcp-server/lib/validator.ts +229 -0
package/mcp-server/package-lock.json +165 -0
package/mcp-server/package.json +32 -7
package/mcp-server/premium-tools.js +2 -2
package/mcp-server/registry/tools.json +476 -0
package/mcp-server/schemas/error-envelope.schema.json +125 -0
package/mcp-server/schemas/finding.schema.json +167 -0
package/mcp-server/schemas/report-artifact.schema.json +88 -0
package/mcp-server/schemas/run-request.schema.json +75 -0
package/mcp-server/schemas/verdict.schema.json +168 -0
package/mcp-server/tier-auth.d.ts +71 -0
package/mcp-server/tier-auth.js +371 -183
package/mcp-server/truth-context.js +90 -131
package/mcp-server/truth-firewall-tools.js +1000 -1611
package/mcp-server/tsconfig.json +34 -0
package/mcp-server/vibecheck-tools.js +2 -2
package/mcp-server/vitest.config.ts +16 -0
package/package.json +3 -4
package/bin/runners/lib/agent-firewall/ai/false-positive-analyzer.js +0 -474
package/bin/runners/lib/agent-firewall/change-packet/builder.js +0 -488
package/bin/runners/lib/agent-firewall/change-packet/schema.json +0 -228
package/bin/runners/lib/agent-firewall/change-packet/store.js +0 -200
package/bin/runners/lib/agent-firewall/claims/claim-types.js +0 -21
package/bin/runners/lib/agent-firewall/claims/extractor.js +0 -303
package/bin/runners/lib/agent-firewall/claims/patterns.js +0 -24
package/bin/runners/lib/agent-firewall/critic/index.js +0 -151
package/bin/runners/lib/agent-firewall/critic/judge.js +0 -432
package/bin/runners/lib/agent-firewall/critic/prompts.js +0 -305
package/bin/runners/lib/agent-firewall/evidence/auth-evidence.js +0 -88
package/bin/runners/lib/agent-firewall/evidence/contract-evidence.js +0 -75
package/bin/runners/lib/agent-firewall/evidence/env-evidence.js +0 -127
package/bin/runners/lib/agent-firewall/evidence/resolver.js +0 -102
package/bin/runners/lib/agent-firewall/evidence/route-evidence.js +0 -213
package/bin/runners/lib/agent-firewall/evidence/side-effect-evidence.js +0 -145
package/bin/runners/lib/agent-firewall/fs-hook/daemon.js +0 -19
package/bin/runners/lib/agent-firewall/fs-hook/installer.js +0 -87
package/bin/runners/lib/agent-firewall/fs-hook/watcher.js +0 -184
package/bin/runners/lib/agent-firewall/git-hook/pre-commit.js +0 -163
package/bin/runners/lib/agent-firewall/ide-extension/cursor.js +0 -107
package/bin/runners/lib/agent-firewall/ide-extension/vscode.js +0 -68
package/bin/runners/lib/agent-firewall/ide-extension/windsurf.js +0 -66
package/bin/runners/lib/agent-firewall/interceptor/base.js +0 -304
package/bin/runners/lib/agent-firewall/interceptor/cursor.js +0 -35
package/bin/runners/lib/agent-firewall/interceptor/vscode.js +0 -35
package/bin/runners/lib/agent-firewall/interceptor/windsurf.js +0 -34
package/bin/runners/lib/agent-firewall/lawbook/distributor.js +0 -465
package/bin/runners/lib/agent-firewall/lawbook/evaluator.js +0 -604
package/bin/runners/lib/agent-firewall/lawbook/index.js +0 -304
package/bin/runners/lib/agent-firewall/lawbook/registry.js +0 -514
package/bin/runners/lib/agent-firewall/lawbook/schema.js +0 -420
package/bin/runners/lib/agent-firewall/logger.js +0 -141
package/bin/runners/lib/agent-firewall/policy/default-policy.json +0 -90
package/bin/runners/lib/agent-firewall/policy/engine.js +0 -103
package/bin/runners/lib/agent-firewall/policy/loader.js +0 -451
package/bin/runners/lib/agent-firewall/policy/rules/auth-drift.js +0 -50
package/bin/runners/lib/agent-firewall/policy/rules/contract-drift.js +0 -50
package/bin/runners/lib/agent-firewall/policy/rules/fake-success.js +0 -86
package/bin/runners/lib/agent-firewall/policy/rules/ghost-env.js +0 -162
package/bin/runners/lib/agent-firewall/policy/rules/ghost-route.js +0 -189
package/bin/runners/lib/agent-firewall/policy/rules/scope.js +0 -93
package/bin/runners/lib/agent-firewall/policy/rules/unsafe-side-effect.js +0 -57
package/bin/runners/lib/agent-firewall/policy/schema.json +0 -183
package/bin/runners/lib/agent-firewall/policy/verdict.js +0 -54
package/bin/runners/lib/agent-firewall/proposal/extractor.js +0 -394
package/bin/runners/lib/agent-firewall/proposal/index.js +0 -212
package/bin/runners/lib/agent-firewall/proposal/schema.js +0 -251
package/bin/runners/lib/agent-firewall/proposal/validator.js +0 -386
package/bin/runners/lib/agent-firewall/reality/index.js +0 -332
package/bin/runners/lib/agent-firewall/reality/state.js +0 -625
package/bin/runners/lib/agent-firewall/reality/watcher.js +0 -322
package/bin/runners/lib/agent-firewall/risk/index.js +0 -173
package/bin/runners/lib/agent-firewall/risk/scorer.js +0 -328
package/bin/runners/lib/agent-firewall/risk/thresholds.js +0 -321
package/bin/runners/lib/agent-firewall/risk/vectors.js +0 -421
package/bin/runners/lib/agent-firewall/simulator/diff-simulator.js +0 -472
package/bin/runners/lib/agent-firewall/simulator/import-resolver.js +0 -346
package/bin/runners/lib/agent-firewall/simulator/index.js +0 -181
package/bin/runners/lib/agent-firewall/simulator/route-validator.js +0 -380
package/bin/runners/lib/agent-firewall/time-machine/incident-correlator.js +0 -661
package/bin/runners/lib/agent-firewall/time-machine/index.js +0 -267
package/bin/runners/lib/agent-firewall/time-machine/replay-engine.js +0 -436
package/bin/runners/lib/agent-firewall/time-machine/state-reconstructor.js +0 -490
package/bin/runners/lib/agent-firewall/time-machine/timeline-builder.js +0 -530
package/bin/runners/lib/agent-firewall/truthpack/index.js +0 -67
package/bin/runners/lib/agent-firewall/truthpack/loader.js +0 -137
package/bin/runners/lib/agent-firewall/unblock/planner.js +0 -337
package/bin/runners/lib/agent-firewall/utils/ignore-checker.js +0 -118
package/bin/runners/lib/api-client.js +0 -269
package/bin/runners/lib/authority-badge.js +0 -425
package/bin/runners/lib/engines/accessibility-engine.js +0 -190
package/bin/runners/lib/engines/api-consistency-engine.js +0 -162
package/bin/runners/lib/engines/ast-cache.js +0 -99
package/bin/runners/lib/engines/code-quality-engine.js +0 -255
package/bin/runners/lib/engines/console-logs-engine.js +0 -115
package/bin/runners/lib/engines/cross-file-analysis-engine.js +0 -268
package/bin/runners/lib/engines/dead-code-engine.js +0 -198
package/bin/runners/lib/engines/deprecated-api-engine.js +0 -226
package/bin/runners/lib/engines/empty-catch-engine.js +0 -150
package/bin/runners/lib/engines/file-filter.js +0 -131
package/bin/runners/lib/engines/hardcoded-secrets-engine.js +0 -251
package/bin/runners/lib/engines/mock-data-engine.js +0 -272
package/bin/runners/lib/engines/parallel-processor.js +0 -71
package/bin/runners/lib/engines/performance-issues-engine.js +0 -265
package/bin/runners/lib/engines/security-vulnerabilities-engine.js +0 -243
package/bin/runners/lib/engines/todo-fixme-engine.js +0 -115
package/bin/runners/lib/engines/type-aware-engine.js +0 -152
package/bin/runners/lib/engines/unsafe-regex-engine.js +0 -225
package/bin/runners/lib/engines/vibecheck-engines/README.md +0 -53
package/bin/runners/lib/engines/vibecheck-engines/index.js +0 -15
package/bin/runners/lib/engines/vibecheck-engines/lib/ast-cache.js +0 -164
package/bin/runners/lib/engines/vibecheck-engines/lib/code-quality-engine.js +0 -291
package/bin/runners/lib/engines/vibecheck-engines/lib/console-logs-engine.js +0 -83
package/bin/runners/lib/engines/vibecheck-engines/lib/dead-code-engine.js +0 -198
package/bin/runners/lib/engines/vibecheck-engines/lib/deprecated-api-engine.js +0 -275
package/bin/runners/lib/engines/vibecheck-engines/lib/empty-catch-engine.js +0 -167
package/bin/runners/lib/engines/vibecheck-engines/lib/file-filter.js +0 -217
package/bin/runners/lib/engines/vibecheck-engines/lib/hardcoded-secrets-engine.js +0 -139
package/bin/runners/lib/engines/vibecheck-engines/lib/mock-data-engine.js +0 -140
package/bin/runners/lib/engines/vibecheck-engines/lib/parallel-processor.js +0 -164
package/bin/runners/lib/engines/vibecheck-engines/lib/performance-issues-engine.js +0 -234
package/bin/runners/lib/engines/vibecheck-engines/lib/type-aware-engine.js +0 -217
package/bin/runners/lib/engines/vibecheck-engines/lib/unsafe-regex-engine.js +0 -78
package/bin/runners/lib/engines/vibecheck-engines/package.json +0 -13
package/bin/runners/lib/exit-codes.js +0 -275
package/bin/runners/lib/fingerprint.js +0 -377
package/bin/runners/lib/help-formatter.js +0 -413
package/bin/runners/lib/logger.js +0 -38
package/bin/runners/lib/ship-output-enterprise.js +0 -239
package/bin/runners/lib/unified-cli-output.js +0 -604
package/bin/runners/runAgent.d.ts +0 -5
package/bin/runners/runAgent.js +0 -161
package/bin/runners/runApprove.js +0 -1200
package/bin/runners/runClassify.js +0 -859
package/bin/runners/runContext.d.ts +0 -4
package/bin/runners/runFirewall.d.ts +0 -5
package/bin/runners/runFirewall.js +0 -134
package/bin/runners/runFirewallHook.d.ts +0 -5
package/bin/runners/runFirewallHook.js +0 -56
package/bin/runners/runPolish.d.ts +0 -4
package/bin/runners/runProof.zip +0 -0
package/bin/runners/runTruth.d.ts +0 -5
package/bin/runners/runTruth.js +0 -101
package/mcp-server/HARDENING_SUMMARY.md +0 -299
package/mcp-server/agent-firewall-interceptor.js +0 -500
package/mcp-server/authority-tools.js +0 -569
package/mcp-server/conductor/conflict-resolver.js +0 -588
package/mcp-server/conductor/execution-planner.js +0 -544
package/mcp-server/conductor/index.js +0 -377
package/mcp-server/conductor/lock-manager.js +0 -615
package/mcp-server/conductor/request-queue.js +0 -550
package/mcp-server/conductor/session-manager.js +0 -500
package/mcp-server/conductor/tools.js +0 -510
package/mcp-server/lib/api-client.cjs +0 -13
package/mcp-server/lib/logger.cjs +0 -30
package/mcp-server/logger.js +0 -173
package/mcp-server/tools-v3.js +0 -706
package/mcp-server/vibecheck-mcp-server-3.2.0.tgz +0 -0

package/mcp-server/__tests__/schemas.test.ts ADDED Viewed

@@ -0,0 +1,372 @@
+/**
+ * Schema Validation Tests
+ *
+ * Ensures all canonical schemas are valid and work correctly.
+ */
+import { describe, it, expect, beforeAll } from 'vitest';
+import {
+  validateRunRequest,
+  validateFinding,
+  validateVerdict,
+  validateErrorEnvelope,
+  validateToolInput,
+  normalizeFindingId,
+  validateProjectPath,
+  ValidationError,
+} from '../lib/validator.js';
+describe('Schema Validation', () => {
+  describe('RunRequest Schema', () => {
+    it('should validate a valid run request', () => {
+      const request = {
+        tool: 'vibecheck.scan',
+        projectPath: '/home/user/project',
+        timeout: 60000,
+        cache: { mode: 'auto', maxAge: 300 },
+        options: { profile: 'quick' },
+      };
+      const result = validateRunRequest(request);
+      expect(result.valid).toBe(true);
+      expect(result.errors).toBeUndefined();
+    });
+    it('should reject invalid tool name format', () => {
+      const request = {
+        tool: 'invalid-tool', // Should be vibecheck.xxx
+        projectPath: '/home/user/project',
+      };
+      const result = validateRunRequest(request);
+      expect(result.valid).toBe(false);
+      expect(result.errors).toBeDefined();
+      expect(result.errors?.some((e: ValidationError) => e.path.includes('tool'))).toBe(true);
+    });
+    it('should require projectPath', () => {
+      const request = {
+        tool: 'vibecheck.scan',
+      };
+      const result = validateRunRequest(request);
+      expect(result.valid).toBe(false);
+    });
+    it('should validate timeout bounds', () => {
+      const tooShort = {
+        tool: 'vibecheck.scan',
+        projectPath: '/home/user/project',
+        timeout: 500, // Below minimum (1000)
+      };
+      const tooLong = {
+        tool: 'vibecheck.scan',
+        projectPath: '/home/user/project',
+        timeout: 700000, // Above maximum (600000)
+      };
+      expect(validateRunRequest(tooShort).valid).toBe(false);
+      expect(validateRunRequest(tooLong).valid).toBe(false);
+    });
+    it('should validate cache mode enum', () => {
+      const valid = {
+        tool: 'vibecheck.scan',
+        projectPath: '/home/user/project',
+        cache: { mode: 'force' },
+      };
+      const invalid = {
+        tool: 'vibecheck.scan',
+        projectPath: '/home/user/project',
+        cache: { mode: 'invalid' },
+      };
+      expect(validateRunRequest(valid).valid).toBe(true);
+      expect(validateRunRequest(invalid).valid).toBe(false);
+    });
+  });
+  describe('Finding Schema', () => {
+    it('should validate a complete finding', () => {
+      const finding = {
+        id: 'auth_gap-a1b2c3d4',
+        category: 'auth_gap',
+        severity: 'BLOCK',
+        title: 'Unprotected API endpoint',
+        description: 'The /api/admin endpoint has no authentication',
+        evidence: [
+          {
+            file: 'src/routes/admin.ts',
+            line: 42,
+            snippet: 'router.get("/admin", handler)',
+            reason: 'No auth middleware',
+          },
+        ],
+        fixHints: ['Add withAuth middleware'],
+        confidence: 0.95,
+        source: 'static',
+      };
+      const result = validateFinding(finding);
+      expect(result.valid).toBe(true);
+    });
+    it('should require evidence array with at least one item', () => {
+      const finding = {
+        id: 'auth_gap-a1b2c3d4',
+        category: 'auth_gap',
+        severity: 'BLOCK',
+        title: 'Missing auth',
+        evidence: [], // Empty array
+      };
+      const result = validateFinding(finding);
+      expect(result.valid).toBe(false);
+    });
+    it('should validate severity enum', () => {
+      const valid = {
+        id: 'test-12345678',
+        category: 'secrets',
+        severity: 'WARN',
+        title: 'Test',
+        evidence: [{ file: 'test.ts' }],
+      };
+      const invalid = {
+        ...valid,
+        severity: 'CRITICAL', // Not in enum
+      };
+      expect(validateFinding(valid).valid).toBe(true);
+      expect(validateFinding(invalid).valid).toBe(false);
+    });
+    it('should validate category enum', () => {
+      const validCategories = ['secrets', 'auth_gap', 'billing_bypass', 'dead_ui', 'fake_success'];
+      for (const category of validCategories) {
+        const finding = {
+          id: `${category}-12345678`,
+          category,
+          severity: 'WARN',
+          title: 'Test',
+          evidence: [{ file: 'test.ts' }],
+        };
+        expect(validateFinding(finding).valid).toBe(true);
+      }
+    });
+    it('should validate finding ID format', () => {
+      const validIds = ['auth_gap-a1b2c3d4', 'secrets-12345678', 'dead_ui-abcdef12'];
+      const invalidIds = ['invalid', 'AUTH_GAP-123', 'auth_gap_123'];
+      for (const id of validIds) {
+        const finding = {
+          id,
+          category: 'secrets',
+          severity: 'WARN',
+          title: 'Test',
+          evidence: [{ file: 'test.ts' }],
+        };
+        expect(validateFinding(finding).valid).toBe(true);
+      }
+      for (const id of invalidIds) {
+        const finding = {
+          id,
+          category: 'secrets',
+          severity: 'WARN',
+          title: 'Test',
+          evidence: [{ file: 'test.ts' }],
+        };
+        expect(validateFinding(finding).valid).toBe(false);
+      }
+    });
+  });
+  describe('Verdict Schema', () => {
+    it('should validate a complete verdict', () => {
+      const verdict = {
+        verdict: 'SHIP',
+        score: 95,
+        grade: 'A',
+        summary: {
+          block: 0,
+          warn: 2,
+          info: 5,
+          total: 7,
+        },
+        findings: [],
+        meta: {
+          version: '3.0.0',
+          runId: 'run_abc123',
+          timestamp: '2024-01-15T10:30:00Z',
+          durationMs: 5000,
+        },
+      };
+      const result = validateVerdict(verdict);
+      expect(result.valid).toBe(true);
+    });
+    it('should validate verdict enum', () => {
+      const base = {
+        score: 50,
+        summary: { block: 0, warn: 0, info: 0, total: 0 },
+        findings: [],
+        meta: {
+          version: '3.0.0',
+          runId: 'run_123',
+          timestamp: '2024-01-15T10:30:00Z',
+          durationMs: 1000,
+        },
+      };
+      expect(validateVerdict({ ...base, verdict: 'SHIP' }).valid).toBe(true);
+      expect(validateVerdict({ ...base, verdict: 'WARN' }).valid).toBe(true);
+      expect(validateVerdict({ ...base, verdict: 'BLOCK' }).valid).toBe(true);
+      expect(validateVerdict({ ...base, verdict: 'MAYBE' }).valid).toBe(false);
+    });
+    it('should validate score bounds', () => {
+      const base = {
+        verdict: 'SHIP',
+        summary: { block: 0, warn: 0, info: 0, total: 0 },
+        findings: [],
+        meta: {
+          version: '3.0.0',
+          runId: 'run_123',
+          timestamp: '2024-01-15T10:30:00Z',
+          durationMs: 1000,
+        },
+      };
+      expect(validateVerdict({ ...base, score: 0 }).valid).toBe(true);
+      expect(validateVerdict({ ...base, score: 100 }).valid).toBe(true);
+      expect(validateVerdict({ ...base, score: -1 }).valid).toBe(false);
+      expect(validateVerdict({ ...base, score: 101 }).valid).toBe(false);
+    });
+  });
+  describe('ErrorEnvelope Schema', () => {
+    it('should validate a complete error envelope', () => {
+      const envelope = {
+        ok: false,
+        error: {
+          code: 'TIMEOUT',
+          message: 'Operation timed out after 60000ms',
+          retryable: true,
+          retryAfterMs: 5000,
+          userAction: 'Try again with a smaller scope',
+        },
+        requestId: 'req_abc123',
+        timestamp: '2024-01-15T10:30:00Z',
+      };
+      const result = validateErrorEnvelope(envelope);
+      expect(result.valid).toBe(true);
+    });
+    it('should require ok to be false', () => {
+      const envelope = {
+        ok: true, // Should be false
+        error: {
+          code: 'TIMEOUT',
+          message: 'Test',
+        },
+        requestId: 'req_123',
+        timestamp: '2024-01-15T10:30:00Z',
+      };
+      const result = validateErrorEnvelope(envelope);
+      expect(result.valid).toBe(false);
+    });
+    it('should validate error code enum', () => {
+      const validCodes = ['INVALID_INPUT', 'TIMEOUT', 'PATH_NOT_FOUND', 'TIER_REQUIRED'];
+      for (const code of validCodes) {
+        const envelope = {
+          ok: false,
+          error: { code, message: 'Test' },
+          requestId: 'req_123',
+          timestamp: '2024-01-15T10:30:00Z',
+        };
+        expect(validateErrorEnvelope(envelope).valid).toBe(true);
+      }
+    });
+  });
+  describe('Tool Input Validation', () => {
+    it('should validate vibecheck.scan input', () => {
+      const valid = { profile: 'quick' };
+      const invalid = { profile: 'invalid_profile' };
+      expect(validateToolInput('vibecheck.scan', valid).valid).toBe(true);
+      expect(validateToolInput('vibecheck.scan', invalid).valid).toBe(false);
+    });
+    it('should validate vibecheck.reality required fields', () => {
+      const valid = { url: 'http://localhost:3000' };
+      const invalid = {}; // Missing required url
+      expect(validateToolInput('vibecheck.reality', valid).valid).toBe(true);
+      expect(validateToolInput('vibecheck.reality', invalid).valid).toBe(false);
+    });
+    it('should return error for unknown tool', () => {
+      const result = validateToolInput('vibecheck.unknown_tool', {});
+      expect(result.valid).toBe(false);
+      expect(result.errors?.some((e: ValidationError) => e.message.includes('Unknown tool'))).toBe(true);
+    });
+  });
+  describe('Finding ID Normalization', () => {
+    it('should create deterministic IDs', () => {
+      const evidence = { file: 'src/api.ts', line: 42 };
+      const id1 = normalizeFindingId('auth_gap', evidence);
+      const id2 = normalizeFindingId('auth_gap', evidence);
+      expect(id1).toBe(id2);
+      expect(id1).toMatch(/^auth_gap-[a-f0-9]{8}$/);
+    });
+    it('should produce different IDs for different evidence', () => {
+      const id1 = normalizeFindingId('auth_gap', { file: 'a.ts', line: 1 });
+      const id2 = normalizeFindingId('auth_gap', { file: 'b.ts', line: 1 });
+      const id3 = normalizeFindingId('auth_gap', { file: 'a.ts', line: 2 });
+      expect(id1).not.toBe(id2);
+      expect(id1).not.toBe(id3);
+      expect(id2).not.toBe(id3);
+    });
+  });
+  describe('Project Path Validation', () => {
+    it('should accept valid paths within workspace', () => {
+      const result = validateProjectPath('/home/user/project', '/home/user');
+      expect(result.valid).toBe(true);
+    });
+    it('should reject path traversal', () => {
+      const result = validateProjectPath('/home/user/../etc/passwd', '/home/user');
+      expect(result.valid).toBe(false);
+      expect(result.error).toContain('traversal');
+    });
+    it('should reject paths outside workspace', () => {
+      const result = validateProjectPath('/etc/passwd', '/home/user');
+      expect(result.valid).toBe(false);
+    });
+    it('should normalize paths', () => {
+      const result = validateProjectPath('project//src///file.ts');
+      expect(result.valid).toBe(true);
+      expect(result.normalized).toBe('project/src/file.ts');
+    });
+  });
+});

package/mcp-server/benchmarks/run-benchmarks.ts ADDED Viewed

@@ -0,0 +1,304 @@
+/**
+ * MCP Server Benchmarks
+ *
+ * Measures performance for core tools.
+ * Shows cache benefit and correctness.
+ *
+ * Usage:
+ *   npx tsx benchmarks/run-benchmarks.ts [projectPath]
+ *
+ * TARGETS:
+ * - Warm runs 3-10x faster than cold
+ * - doctor warm <500ms (realistic <1.5s on Windows)
+ * - scan warm <3000ms
+ * - ship warm <2000ms
+ * - status warm <100ms
+ */
+import { performance } from 'perf_hooks';
+import { existsSync, mkdirSync, writeFileSync, rmSync } from 'fs';
+import { join } from 'path';
+import { tmpdir } from 'os';
+import { handleTool, ToolRequest } from '../handlers/tool-handler.js';
+import { getGlobalCache, initGlobalCache } from '../lib/cache.js';
+import { initLogger, LogLevel } from '../lib/logger.js';
+import { getMetricsCollector, initMetricsCollector } from '../lib/metrics.js';
+interface BenchmarkResult {
+  tool: string;
+  coldRun: number;
+  warmRun: number;
+  cacheHit: boolean;
+  speedup: number;
+  correct: boolean;
+  error?: string;
+}
+interface BenchmarkTargets {
+  warmTarget: number;
+  coldTarget: number;
+}
+const TARGETS: Record<string, BenchmarkTargets> = {
+  doctor: { warmTarget: 500, coldTarget: 3000 },
+  scan: { warmTarget: 3000, coldTarget: 15000 },
+  ship: { warmTarget: 2000, coldTarget: 10000 },
+  status: { warmTarget: 100, coldTarget: 1000 },
+};
+/**
+ * Create test fixture if needed
+ */
+function createTestFixture(): string {
+  const fixtureDir = join(tmpdir(), `vibecheck-bench-${Date.now()}`);
+  mkdirSync(fixtureDir, { recursive: true });
+  // Create minimal project structure
+  writeFileSync(join(fixtureDir, 'package.json'), JSON.stringify({
+    name: 'benchmark-fixture',
+    version: '1.0.0',
+    dependencies: { express: '^4.18.0' },
+  }));
+  mkdirSync(join(fixtureDir, 'src'));
+  writeFileSync(join(fixtureDir, 'src', 'index.ts'), `
+    import express from 'express';
+    const app = express();
+    app.get('/api/test', (req, res) => res.json({ ok: true }));
+    export default app;
+  `);
+  mkdirSync(join(fixtureDir, '.vibecheck'), { recursive: true });
+  return fixtureDir;
+}
+/**
+ * Run a single benchmark
+ */
+async function runBenchmark(
+  tool: string,
+  projectPath: string,
+  options?: Record<string, unknown>
+): Promise<BenchmarkResult> {
+  const cache = getGlobalCache();
+  // Clear cache for cold run
+  cache.clear();
+  // Cold run
+  const coldStart = performance.now();
+  let coldResult: Awaited<ReturnType<typeof handleTool>>;
+  try {
+    coldResult = await handleTool({
+      tool: `vibecheck.${tool}`,
+      projectPath,
+      options,
+      cache: { mode: 'auto' },
+    });
+  } catch (e) {
+    return {
+      tool,
+      coldRun: -1,
+      warmRun: -1,
+      cacheHit: false,
+      speedup: 0,
+      correct: false,
+      error: (e as Error).message,
+    };
+  }
+  const coldTime = performance.now() - coldStart;
+  // Verify cold run correctness
+  const coldCorrect = coldResult.ok ||
+    (coldResult as { error?: { code: string } }).error?.code !== 'INTERNAL_ERROR';
+  // Warm run (should hit cache)
+  const warmStart = performance.now();
+  const warmResult = await handleTool({
+    tool: `vibecheck.${tool}`,
+    projectPath,
+    options,
+    cache: { mode: 'auto' },
+  });
+  const warmTime = performance.now() - warmStart;
+  const cacheHit = warmResult.ok &&
+    (warmResult as { meta?: { cached?: boolean } }).meta?.cached === true;
+  const speedup = coldTime / warmTime;
+  return {
+    tool,
+    coldRun: Math.round(coldTime),
+    warmRun: Math.round(warmTime),
+    cacheHit,
+    speedup: Math.round(speedup * 10) / 10,
+    correct: coldCorrect,
+  };
+}
+/**
+ * Print results table
+ */
+function printResults(benchmarks: BenchmarkResult[]): void {
+  console.log('');
+  console.log('╔══════════════════════════════════════════════════════════════════════════╗');
+  console.log('║                              RESULTS                                      ║');
+  console.log('╠═══════════════════════╦═════════╦═════════╦═════════╦═════════╦══════════╣');
+  console.log('║ Tool                  ║ Cold    ║ Warm    ║ Speedup ║ Cache   ║ Correct  ║');
+  console.log('╠═══════════════════════╬═════════╬═════════╬═════════╬═════════╬══════════╣');
+  for (const result of benchmarks) {
+    const tool = result.tool.padEnd(19);
+    const cold = result.coldRun >= 0 ? `${result.coldRun}ms`.padStart(7) : 'ERROR  ';
+    const warm = result.warmRun >= 0 ? `${result.warmRun}ms`.padStart(7) : 'ERROR  ';
+    const speedup = result.speedup > 0 ? `${result.speedup}x`.padStart(7) : 'N/A    ';
+    const cache = result.cacheHit ? '   ✓   ' : '   ✗   ';
+    const correct = result.correct ? '   ✓    ' : '   ✗    ';
+    console.log(`║ ${tool} ║ ${cold} ║ ${warm} ║ ${speedup} ║${cache}║${correct}║`);
+  }
+  console.log('╚═══════════════════════╩═════════╩═════════╩═════════╩═════════╩══════════╝');
+}
+/**
+ * Print target checks
+ */
+function printTargetChecks(benchmarks: BenchmarkResult[]): void {
+  console.log('');
+  console.log('Target Checks:');
+  let allPassed = true;
+  for (const result of benchmarks) {
+    const targets = TARGETS[result.tool];
+    if (!targets) continue;
+    const warmPass = result.warmRun >= 0 && result.warmRun <= targets.warmTarget;
+    const coldPass = result.coldRun >= 0 && result.coldRun <= targets.coldTarget;
+    console.log(`  ${result.tool}:`);
+    console.log(`    warm <${targets.warmTarget}ms: ${warmPass ? '✓ PASS' : '✗ FAIL'} (${result.warmRun}ms)`);
+    console.log(`    cold <${targets.coldTarget}ms: ${coldPass ? '✓ PASS' : '✗ FAIL'} (${result.coldRun}ms)`);
+    if (!warmPass || !coldPass) allPassed = false;
+  }
+  // Speedup check
+  const avgSpeedup = benchmarks.filter(b => b.speedup > 0).reduce((sum, b) => sum + b.speedup, 0) /
+                     benchmarks.filter(b => b.speedup > 0).length || 0;
+  const speedupPass = avgSpeedup >= 3;
+  console.log(`  Average speedup >=3x: ${speedupPass ? '✓ PASS' : '✗ FAIL'} (${avgSpeedup.toFixed(1)}x)`);
+  if (!speedupPass) allPassed = false;
+  return;
+}
+/**
+ * Main benchmark runner
+ */
+async function main() {
+  // Initialize logging (quiet for benchmarks)
+  initLogger({
+    level: LogLevel.ERROR,
+    enableConsole: false,
+    enableFile: false
+  });
+  // Initialize cache and metrics
+  initGlobalCache({ maxMemoryEntries: 100, defaultTtl: 300 });
+  initMetricsCollector({ maxEntries: 1000 });
+  // Get or create project path
+  let projectPath = process.argv[2];
+  let createdFixture = false;
+  if (!projectPath || !existsSync(projectPath)) {
+    console.log('No valid project path provided. Creating test fixture...');
+    projectPath = createTestFixture();
+    createdFixture = true;
+  }
+  console.log('╔══════════════════════════════════════════════════════════════╗');
+  console.log('║           Vibecheck MCP Server Benchmarks                     ║');
+  console.log('╠══════════════════════════════════════════════════════════════╣');
+  console.log(`║ Project: ${projectPath.slice(0, 50).padEnd(50)} ║`);
+  console.log('╚══════════════════════════════════════════════════════════════╝');
+  console.log('');
+  const benchmarks: BenchmarkResult[] = [];
+  const toolsToTest = ['doctor', 'scan', 'ship', 'status'];
+  for (const tool of toolsToTest) {
+    console.log(`Running vibecheck.${tool}...`);
+    try {
+      const options = tool === 'scan' ? { profile: 'quick' } : undefined;
+      const result = await runBenchmark(tool, projectPath, options);
+      benchmarks.push(result);
+      if (result.error) {
+        console.log(`  Warning: ${result.error}`);
+      }
+    } catch (e) {
+      console.log(`  Error: ${e}`);
+      benchmarks.push({
+        tool,
+        coldRun: -1,
+        warmRun: -1,
+        cacheHit: false,
+        speedup: 0,
+        correct: false,
+        error: (e as Error).message,
+      });
+    }
+  }
+  // Print results
+  printResults(benchmarks);
+  // Summary
+  console.log('');
+  console.log('Summary:');
+  const successful = benchmarks.filter(b => b.correct);
+  const withCache = benchmarks.filter(b => b.cacheHit);
+  const avgSpeedup = successful.filter(b => b.speedup > 0).reduce((sum, b) => sum + b.speedup, 0) /
+                     successful.filter(b => b.speedup > 0).length || 0;
+  console.log(`  Tools tested: ${benchmarks.length}`);
+  console.log(`  Successful:   ${successful.length}/${benchmarks.length}`);
+  console.log(`  Cache hits:   ${withCache.length}/${benchmarks.length}`);
+  console.log(`  Avg speedup:  ${avgSpeedup.toFixed(1)}x`);
+  // Target checks
+  printTargetChecks(benchmarks);
+  // Metrics summary
+  const metrics = getMetricsCollector();
+  const summary = metrics.getSummary();
+  console.log('');
+  console.log('Metrics:');
+  console.log(`  Cache hit rate: ${(summary.cacheHitRate * 100).toFixed(1)}%`);
+  // Cleanup fixture if we created it
+  if (createdFixture) {
+    console.log('');
+    console.log('Cleaning up test fixture...');
+    rmSync(projectPath, { recursive: true, force: true });
+  }
+  // Exit code based on results
+  const allPassed = successful.length === benchmarks.length &&
+                    withCache.length >= Math.floor(benchmarks.length / 2) &&
+                    avgSpeedup >= 2;
+  process.exit(allPassed ? 0 : 1);
+}
+main().catch(err => {
+  console.error('Benchmark failed:', err);
+  process.exit(1);
+});

package/mcp-server/examples/doctor.request.json ADDED Viewed

@@ -0,0 +1,14 @@
+{
+  "tool": "vibecheck.doctor",
+  "projectPath": "/home/user/my-project",
+  "requestId": "req_1a2b3c4d",
+  "timeout": 30000,
+  "cache": {
+    "mode": "auto",
+    "maxAge": 300
+  },
+  "options": {
+    "category": "all",
+    "fix": false
+  }
+}