npm - @peakinfer/cli - Versions diffs - 1.0.133 - Mend

@peakinfer/cli 1.0.133

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (367) hide show

package/.claude/settings.local.json +8 -0
package/.env.example +6 -0
package/.github/workflows/peakinfer.yml +64 -0
package/CHANGELOG.md +31 -0
package/LICENSE +190 -0
package/README.md +335 -0
package/data/inferencemax.json +274 -0
package/dist/agent-analyzer.d.ts +45 -0
package/dist/agent-analyzer.d.ts.map +1 -0
package/dist/agent-analyzer.js +374 -0
package/dist/agent-analyzer.js.map +1 -0
package/dist/agent.d.ts +76 -0
package/dist/agent.d.ts.map +1 -0
package/dist/agent.js +965 -0
package/dist/agent.js.map +1 -0
package/dist/agents/correlation-analyzer.d.ts +34 -0
package/dist/agents/correlation-analyzer.d.ts.map +1 -0
package/dist/agents/correlation-analyzer.js +261 -0
package/dist/agents/correlation-analyzer.js.map +1 -0
package/dist/agents/index.d.ts +91 -0
package/dist/agents/index.d.ts.map +1 -0
package/dist/agents/index.js +111 -0
package/dist/agents/index.js.map +1 -0
package/dist/agents/runtime-analyzer.d.ts +38 -0
package/dist/agents/runtime-analyzer.d.ts.map +1 -0
package/dist/agents/runtime-analyzer.js +244 -0
package/dist/agents/runtime-analyzer.js.map +1 -0
package/dist/analysis-types.d.ts +500 -0
package/dist/analysis-types.d.ts.map +1 -0
package/dist/analysis-types.js +11 -0
package/dist/analysis-types.js.map +1 -0
package/dist/analytics.d.ts +25 -0
package/dist/analytics.d.ts.map +1 -0
package/dist/analytics.js +94 -0
package/dist/analytics.js.map +1 -0
package/dist/analyzer.d.ts +48 -0
package/dist/analyzer.d.ts.map +1 -0
package/dist/analyzer.js +547 -0
package/dist/analyzer.js.map +1 -0
package/dist/artifacts.d.ts +44 -0
package/dist/artifacts.d.ts.map +1 -0
package/dist/artifacts.js +165 -0
package/dist/artifacts.js.map +1 -0
package/dist/benchmarks/index.d.ts +88 -0
package/dist/benchmarks/index.d.ts.map +1 -0
package/dist/benchmarks/index.js +205 -0
package/dist/benchmarks/index.js.map +1 -0
package/dist/cli.d.ts +3 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +427 -0
package/dist/cli.js.map +1 -0
package/dist/commands/ci.d.ts +19 -0
package/dist/commands/ci.d.ts.map +1 -0
package/dist/commands/ci.js +253 -0
package/dist/commands/ci.js.map +1 -0
package/dist/commands/config.d.ts +16 -0
package/dist/commands/config.d.ts.map +1 -0
package/dist/commands/config.js +249 -0
package/dist/commands/config.js.map +1 -0
package/dist/commands/demo.d.ts +15 -0
package/dist/commands/demo.d.ts.map +1 -0
package/dist/commands/demo.js +106 -0
package/dist/commands/demo.js.map +1 -0
package/dist/commands/export.d.ts +14 -0
package/dist/commands/export.d.ts.map +1 -0
package/dist/commands/export.js +209 -0
package/dist/commands/export.js.map +1 -0
package/dist/commands/history.d.ts +15 -0
package/dist/commands/history.d.ts.map +1 -0
package/dist/commands/history.js +389 -0
package/dist/commands/history.js.map +1 -0
package/dist/commands/template.d.ts +14 -0
package/dist/commands/template.d.ts.map +1 -0
package/dist/commands/template.js +341 -0
package/dist/commands/template.js.map +1 -0
package/dist/commands/validate-map.d.ts +12 -0
package/dist/commands/validate-map.d.ts.map +1 -0
package/dist/commands/validate-map.js +274 -0
package/dist/commands/validate-map.js.map +1 -0
package/dist/commands/whatif.d.ts +17 -0
package/dist/commands/whatif.d.ts.map +1 -0
package/dist/commands/whatif.js +206 -0
package/dist/commands/whatif.js.map +1 -0
package/dist/comparison.d.ts +38 -0
package/dist/comparison.d.ts.map +1 -0
package/dist/comparison.js +223 -0
package/dist/comparison.js.map +1 -0
package/dist/config.d.ts +42 -0
package/dist/config.d.ts.map +1 -0
package/dist/config.js +158 -0
package/dist/config.js.map +1 -0
package/dist/connectors/helicone.d.ts +9 -0
package/dist/connectors/helicone.d.ts.map +1 -0
package/dist/connectors/helicone.js +106 -0
package/dist/connectors/helicone.js.map +1 -0
package/dist/connectors/index.d.ts +37 -0
package/dist/connectors/index.d.ts.map +1 -0
package/dist/connectors/index.js +65 -0
package/dist/connectors/index.js.map +1 -0
package/dist/connectors/langsmith.d.ts +9 -0
package/dist/connectors/langsmith.d.ts.map +1 -0
package/dist/connectors/langsmith.js +122 -0
package/dist/connectors/langsmith.js.map +1 -0
package/dist/connectors/types.d.ts +83 -0
package/dist/connectors/types.d.ts.map +1 -0
package/dist/connectors/types.js +98 -0
package/dist/connectors/types.js.map +1 -0
package/dist/cost-estimator.d.ts +46 -0
package/dist/cost-estimator.d.ts.map +1 -0
package/dist/cost-estimator.js +104 -0
package/dist/cost-estimator.js.map +1 -0
package/dist/costs.d.ts +57 -0
package/dist/costs.d.ts.map +1 -0
package/dist/costs.js +251 -0
package/dist/costs.js.map +1 -0
package/dist/counterfactuals.d.ts +29 -0
package/dist/counterfactuals.d.ts.map +1 -0
package/dist/counterfactuals.js +448 -0
package/dist/counterfactuals.js.map +1 -0
package/dist/enhancement-prompts.d.ts +41 -0
package/dist/enhancement-prompts.d.ts.map +1 -0
package/dist/enhancement-prompts.js +88 -0
package/dist/enhancement-prompts.js.map +1 -0
package/dist/envelopes.d.ts +20 -0
package/dist/envelopes.d.ts.map +1 -0
package/dist/envelopes.js +790 -0
package/dist/envelopes.js.map +1 -0
package/dist/format-normalizer.d.ts +71 -0
package/dist/format-normalizer.d.ts.map +1 -0
package/dist/format-normalizer.js +1331 -0
package/dist/format-normalizer.js.map +1 -0
package/dist/history.d.ts +79 -0
package/dist/history.d.ts.map +1 -0
package/dist/history.js +313 -0
package/dist/history.js.map +1 -0
package/dist/html.d.ts +11 -0
package/dist/html.d.ts.map +1 -0
package/dist/html.js +463 -0
package/dist/html.js.map +1 -0
package/dist/impact.d.ts +42 -0
package/dist/impact.d.ts.map +1 -0
package/dist/impact.js +443 -0
package/dist/impact.js.map +1 -0
package/dist/index.d.ts +26 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +34 -0
package/dist/index.js.map +1 -0
package/dist/insights.d.ts +5 -0
package/dist/insights.d.ts.map +1 -0
package/dist/insights.js +271 -0
package/dist/insights.js.map +1 -0
package/dist/joiner.d.ts +9 -0
package/dist/joiner.d.ts.map +1 -0
package/dist/joiner.js +247 -0
package/dist/joiner.js.map +1 -0
package/dist/orchestrator.d.ts +34 -0
package/dist/orchestrator.d.ts.map +1 -0
package/dist/orchestrator.js +827 -0
package/dist/orchestrator.js.map +1 -0
package/dist/pdf.d.ts +26 -0
package/dist/pdf.d.ts.map +1 -0
package/dist/pdf.js +84 -0
package/dist/pdf.js.map +1 -0
package/dist/prediction.d.ts +33 -0
package/dist/prediction.d.ts.map +1 -0
package/dist/prediction.js +316 -0
package/dist/prediction.js.map +1 -0
package/dist/prompts/loader.d.ts +38 -0
package/dist/prompts/loader.d.ts.map +1 -0
package/dist/prompts/loader.js +60 -0
package/dist/prompts/loader.js.map +1 -0
package/dist/renderer.d.ts +64 -0
package/dist/renderer.d.ts.map +1 -0
package/dist/renderer.js +923 -0
package/dist/renderer.js.map +1 -0
package/dist/runid.d.ts +57 -0
package/dist/runid.d.ts.map +1 -0
package/dist/runid.js +199 -0
package/dist/runid.js.map +1 -0
package/dist/runtime.d.ts +29 -0
package/dist/runtime.d.ts.map +1 -0
package/dist/runtime.js +366 -0
package/dist/runtime.js.map +1 -0
package/dist/scanner.d.ts +11 -0
package/dist/scanner.d.ts.map +1 -0
package/dist/scanner.js +426 -0
package/dist/scanner.js.map +1 -0
package/dist/templates.d.ts +120 -0
package/dist/templates.d.ts.map +1 -0
package/dist/templates.js +429 -0
package/dist/templates.js.map +1 -0
package/dist/tools/index.d.ts +153 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +177 -0
package/dist/tools/index.js.map +1 -0
package/dist/types.d.ts +3647 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +703 -0
package/dist/types.js.map +1 -0
package/dist/version.d.ts +7 -0
package/dist/version.d.ts.map +1 -0
package/dist/version.js +23 -0
package/dist/version.js.map +1 -0
package/docs/demo-guide.md +423 -0
package/docs/events-format.md +295 -0
package/docs/inferencemap-spec.md +344 -0
package/docs/migration-v2.md +293 -0
package/fixtures/demo/precomputed.json +142 -0
package/fixtures/demo-project/README.md +52 -0
package/fixtures/demo-project/ai-service.ts +65 -0
package/fixtures/demo-project/sample-events.jsonl +15 -0
package/fixtures/demo-project/src/ai-service.ts +128 -0
package/fixtures/demo-project/src/llm-client.ts +155 -0
package/package.json +65 -0
package/prompts/agent-analyzer.yaml +47 -0
package/prompts/ci-gate.yaml +98 -0
package/prompts/correlation-analyzer.yaml +178 -0
package/prompts/format-normalizer.yaml +46 -0
package/prompts/peak-performance.yaml +180 -0
package/prompts/pr-comment.yaml +111 -0
package/prompts/runtime-analyzer.yaml +189 -0
package/prompts/unified-analyzer.yaml +241 -0
package/schemas/inference-map.v0.1.json +215 -0
package/scripts/benchmark.ts +394 -0
package/scripts/demo-v1.5.sh +158 -0
package/scripts/sync-from-site.sh +197 -0
package/scripts/validate-sync.sh +178 -0
package/src/agent-analyzer.ts +481 -0
package/src/agent.ts +1232 -0
package/src/agents/correlation-analyzer.ts +353 -0
package/src/agents/index.ts +235 -0
package/src/agents/runtime-analyzer.ts +343 -0
package/src/analysis-types.ts +558 -0
package/src/analytics.ts +100 -0
package/src/analyzer.ts +692 -0
package/src/artifacts.ts +218 -0
package/src/benchmarks/index.ts +309 -0
package/src/cli.ts +503 -0
package/src/commands/ci.ts +336 -0
package/src/commands/config.ts +288 -0
package/src/commands/demo.ts +175 -0
package/src/commands/export.ts +297 -0
package/src/commands/history.ts +425 -0
package/src/commands/template.ts +385 -0
package/src/commands/validate-map.ts +324 -0
package/src/commands/whatif.ts +272 -0
package/src/comparison.ts +283 -0
package/src/config.ts +188 -0
package/src/connectors/helicone.ts +164 -0
package/src/connectors/index.ts +93 -0
package/src/connectors/langsmith.ts +179 -0
package/src/connectors/types.ts +180 -0
package/src/cost-estimator.ts +146 -0
package/src/costs.ts +347 -0
package/src/counterfactuals.ts +516 -0
package/src/enhancement-prompts.ts +118 -0
package/src/envelopes.ts +814 -0
package/src/format-normalizer.ts +1486 -0
package/src/history.ts +400 -0
package/src/html.ts +512 -0
package/src/impact.ts +522 -0
package/src/index.ts +83 -0
package/src/insights.ts +341 -0
package/src/joiner.ts +289 -0
package/src/orchestrator.ts +1015 -0
package/src/pdf.ts +110 -0
package/src/prediction.ts +392 -0
package/src/prompts/loader.ts +88 -0
package/src/renderer.ts +1045 -0
package/src/runid.ts +261 -0
package/src/runtime.ts +450 -0
package/src/scanner.ts +508 -0
package/src/templates.ts +561 -0
package/src/tools/index.ts +214 -0
package/src/types.ts +873 -0
package/src/version.ts +24 -0
package/templates/context-accumulation.yaml +23 -0
package/templates/cost-concentration.yaml +20 -0
package/templates/dead-code.yaml +20 -0
package/templates/latency-explainer.yaml +23 -0
package/templates/optimizations/ab-testing-framework.yaml +74 -0
package/templates/optimizations/api-gateway-optimization.yaml +81 -0
package/templates/optimizations/api-model-routing-strategy.yaml +126 -0
package/templates/optimizations/auto-scaling-optimization.yaml +85 -0
package/templates/optimizations/batch-utilization-diagnostic.yaml +142 -0
package/templates/optimizations/comprehensive-apm.yaml +76 -0
package/templates/optimizations/context-window-optimization.yaml +91 -0
package/templates/optimizations/cost-sensitive-batch-processing.yaml +77 -0
package/templates/optimizations/distributed-training-optimization.yaml +77 -0
package/templates/optimizations/document-analysis-edge.yaml +77 -0
package/templates/optimizations/document-pipeline-optimization.yaml +78 -0
package/templates/optimizations/domain-specific-distillation.yaml +78 -0
package/templates/optimizations/error-handling-optimization.yaml +76 -0
package/templates/optimizations/gptq-4bit-quantization.yaml +96 -0
package/templates/optimizations/long-context-memory-management.yaml +78 -0
package/templates/optimizations/max-tokens-optimization.yaml +76 -0
package/templates/optimizations/memory-bandwidth-optimization.yaml +73 -0
package/templates/optimizations/multi-framework-resilience.yaml +75 -0
package/templates/optimizations/multi-tenant-optimization.yaml +75 -0
package/templates/optimizations/prompt-caching-optimization.yaml +143 -0
package/templates/optimizations/pytorch-to-onnx-migration.yaml +109 -0
package/templates/optimizations/quality-monitoring.yaml +74 -0
package/templates/optimizations/realtime-budget-controls.yaml +74 -0
package/templates/optimizations/realtime-latency-optimization.yaml +74 -0
package/templates/optimizations/sglang-concurrency-optimization.yaml +78 -0
package/templates/optimizations/smart-model-routing.yaml +96 -0
package/templates/optimizations/streaming-batch-selection.yaml +167 -0
package/templates/optimizations/system-prompt-optimization.yaml +75 -0
package/templates/optimizations/tensorrt-llm-performance.yaml +77 -0
package/templates/optimizations/vllm-high-throughput-optimization.yaml +93 -0
package/templates/optimizations/vllm-migration-memory-bound.yaml +78 -0
package/templates/overpowered-extraction.yaml +32 -0
package/templates/overpowered-model.yaml +31 -0
package/templates/prompt-bloat.yaml +24 -0
package/templates/retry-explosion.yaml +28 -0
package/templates/schema/insight.schema.json +113 -0
package/templates/schema/optimization.schema.json +180 -0
package/templates/streaming-drift.yaml +30 -0
package/templates/throughput-gap.yaml +21 -0
package/templates/token-underutilization.yaml +28 -0
package/templates/untested-fallback.yaml +21 -0
package/tests/accuracy/drift-detection.test.ts +184 -0
package/tests/accuracy/false-positives.test.ts +166 -0
package/tests/accuracy/templates.test.ts +205 -0
package/tests/action/commands.test.ts +125 -0
package/tests/action/comments.test.ts +347 -0
package/tests/cli.test.ts +203 -0
package/tests/comparison.test.ts +309 -0
package/tests/correlation-analyzer.test.ts +534 -0
package/tests/counterfactuals.test.ts +347 -0
package/tests/fixtures/events/missing-id.jsonl +1 -0
package/tests/fixtures/events/missing-input.jsonl +1 -0
package/tests/fixtures/events/missing-latency.jsonl +1 -0
package/tests/fixtures/events/missing-model.jsonl +1 -0
package/tests/fixtures/events/missing-output.jsonl +1 -0
package/tests/fixtures/events/missing-provider.jsonl +1 -0
package/tests/fixtures/events/missing-ts.jsonl +1 -0
package/tests/fixtures/events/valid.csv +3 -0
package/tests/fixtures/events/valid.json +1 -0
package/tests/fixtures/events/valid.jsonl +2 -0
package/tests/fixtures/events/with-callsite.jsonl +1 -0
package/tests/fixtures/events/with-intent.jsonl +1 -0
package/tests/fixtures/events/wrong-type.jsonl +1 -0
package/tests/fixtures/repos/empty/.gitkeep +0 -0
package/tests/fixtures/repos/hybrid-router/router.py +35 -0
package/tests/fixtures/repos/saas-anthropic/agent.ts +27 -0
package/tests/fixtures/repos/saas-openai/assistant.js +33 -0
package/tests/fixtures/repos/saas-openai/client.py +26 -0
package/tests/fixtures/repos/self-hosted-vllm/inference.py +22 -0
package/tests/github-action.test.ts +292 -0
package/tests/insights.test.ts +878 -0
package/tests/joiner.test.ts +168 -0
package/tests/performance/action-latency.test.ts +132 -0
package/tests/performance/benchmark.test.ts +189 -0
package/tests/performance/cli-latency.test.ts +102 -0
package/tests/pr-comment.test.ts +313 -0
package/tests/prediction.test.ts +296 -0
package/tests/runtime-analyzer.test.ts +375 -0
package/tests/runtime.test.ts +205 -0
package/tests/scanner.test.ts +122 -0
package/tests/template-conformance.test.ts +526 -0
package/tests/unit/cost-calculator.test.ts +303 -0
package/tests/unit/credits.test.ts +180 -0
package/tests/unit/inference-map.test.ts +276 -0
package/tests/unit/schema.test.ts +300 -0
package/tsconfig.json +20 -0
package/vitest.config.ts +14 -0

package/tests/correlation-analyzer.test.ts ADDED Viewed

@@ -0,0 +1,534 @@
+import { describe, it, expect } from 'vitest';
+import { CorrelationAnalyzerAgent, type CorrelationAnalyzerInput } from '../src/agents/correlation-analyzer.js';
+import type { Callsite, InferenceEvent, RuntimeSummary, DriftSignal } from '../src/types.js';
+// =============================================================================
+// TEST FIXTURES
+// =============================================================================
+const makeCallsite = (overrides: Partial<Callsite> = {}): Callsite => ({
+  id: `cs_${Math.random().toString(36).slice(2, 9)}`,
+  file: 'src/api/chat.ts',
+  line: 42,
+  provider: 'openai',
+  model: 'gpt-4o',
+  framework: null,
+  runtime: null,
+  patterns: {},
+  confidence: 0.9,
+  ...overrides,
+});
+const makeEvent = (overrides: Partial<InferenceEvent> = {}): InferenceEvent => ({
+  id: `evt_${Math.random().toString(36).slice(2, 9)}`,
+  ts: '2024-01-01T00:00:00Z',
+  provider: 'openai',
+  model: 'gpt-4o',
+  input_tokens: 100,
+  output_tokens: 50,
+  latency_ms: 420,
+  ...overrides,
+});
+const makeRuntimeSummary = (overrides: Partial<RuntimeSummary> = {}): RuntimeSummary => ({
+  totalEvents: 100,
+  byProvider: {
+    openai: {
+      calls: 100,
+      tokens_in: 10000,
+      tokens_out: 5000,
+      latency_p50: 400,
+      latency_p95: 800,
+      latency_p99: 1200,
+    },
+  },
+  byModel: {
+    'gpt-4o': {
+      calls: 100,
+      tokens_in: 10000,
+      tokens_out: 5000,
+      latency_p50: 400,
+      latency_p95: 800,
+      latency_p99: 1200,
+    },
+  },
+  global: {
+    p50: 400,
+    p95: 800,
+    p99: 1200,
+  },
+  ...overrides,
+});
+const makeInput = (overrides: Partial<CorrelationAnalyzerInput> = {}): CorrelationAnalyzerInput => ({
+  callsites: [makeCallsite()],
+  events: [makeEvent()],
+  runtimeSummary: makeRuntimeSummary(),
+  ...overrides,
+});
+// =============================================================================
+// AGENT PROPERTIES TESTS
+// =============================================================================
+describe('CorrelationAnalyzerAgent', () => {
+  describe('agent properties', () => {
+    it('has correct name', () => {
+      expect(CorrelationAnalyzerAgent.name).toBe('correlation-analyzer');
+    });
+    it('has description', () => {
+      expect(CorrelationAnalyzerAgent.description).toBeDefined();
+      expect(CorrelationAnalyzerAgent.description.length).toBeGreaterThan(0);
+    });
+    it('has tools registry', () => {
+      expect(CorrelationAnalyzerAgent.tools).toBeDefined();
+    });
+  });
+  // =============================================================================
+  // OUTPUT FORMAT TESTS
+  // =============================================================================
+  describe('output format', () => {
+    it('returns correct structure', async () => {
+      const input = makeInput();
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Check insights array
+      expect(Array.isArray(result.insights)).toBe(true);
+      // Check driftSignals array
+      expect(Array.isArray(result.driftSignals)).toBe(true);
+      // Check correlationSummary structure
+      expect(result.correlationSummary).toHaveProperty('totalCodeCallsites');
+      expect(result.correlationSummary).toHaveProperty('totalRuntimeModels');
+      expect(result.correlationSummary).toHaveProperty('matched');
+      expect(result.correlationSummary).toHaveProperty('codeOnly');
+      expect(result.correlationSummary).toHaveProperty('runtimeOnly');
+      expect(result.correlationSummary).toHaveProperty('mismatched');
+      // Check alignment score
+      expect(typeof result.alignmentScore).toBe('number');
+      expect(result.alignmentScore).toBeGreaterThanOrEqual(0);
+      expect(result.alignmentScore).toBeLessThanOrEqual(1);
+      // Check overall assessment
+      expect(typeof result.overallAssessment).toBe('string');
+      expect(result.overallAssessment.length).toBeGreaterThan(0);
+    });
+    it('drift signals have correct type values', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'anthropic', model: 'claude-3-opus' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      const validTypes: DriftSignal['type'][] = ['codeOnly', 'runtimeOnly', 'mismatch', 'patternDrift'];
+      for (const signal of result.driftSignals) {
+        expect(validTypes).toContain(signal.type);
+      }
+    });
+  });
+  // =============================================================================
+  // CORRELATION LOGIC TESTS
+  // =============================================================================
+  describe('correlation logic', () => {
+    it('calculates alignment score for perfect match', async () => {
+      // Same provider:model in both code and runtime
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.alignmentScore).toBeGreaterThanOrEqual(0.5);
+    });
+    it('detects code-only inference points', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'anthropic', model: 'claude-3-opus' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // LLM may classify this as codeOnly, mismatch, or other drift type
+      // Key assertion: alignment should be low and some drift should be detected
+      expect(result.alignmentScore).toBeLessThan(1.0);
+      expect(
+        result.driftSignals.length > 0 ||
+        result.correlationSummary.codeOnly > 0 ||
+        result.correlationSummary.mismatched > 0
+      ).toBe(true);
+    });
+    it('detects runtime-only models', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+            'claude-3-opus': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 500, latency_p95: 1000, latency_p99: 1500 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.driftSignals.some(s => s.type === 'runtimeOnly')).toBe(true);
+      expect(result.correlationSummary.runtimeOnly).toBeGreaterThan(0);
+    });
+    it('generates appropriate overall assessment for good alignment', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.overallAssessment.toLowerCase()).toMatch(/alignment|good|match/);
+    });
+    it('generates appropriate overall assessment for significant drift', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'anthropic', model: 'claude-3-opus' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // LLM may use various terms for mismatch: drift, different, significant, misalignment, mismatch
+      expect(result.overallAssessment.toLowerCase()).toMatch(/drift|different|significant|misalignment|mismatch/);
+    });
+  });
+  // =============================================================================
+  // CORRELATION SUMMARY TESTS
+  // =============================================================================
+  describe('correlation summary', () => {
+    it('counts callsites correctly', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ id: 'cs_1' }),
+          makeCallsite({ id: 'cs_2' }),
+          makeCallsite({ id: 'cs_3' }),
+        ],
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // LLM may dedupe by provider:model or count differently
+      // Key assertion: should detect at least 1 callsite
+      expect(result.correlationSummary.totalCodeCallsites).toBeGreaterThanOrEqual(1);
+    });
+    it('counts runtime models correctly', async () => {
+      const input = makeInput({
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+            'gpt-4o-mini': { calls: 30, tokens_in: 3000, tokens_out: 1500, latency_p50: 200, latency_p95: 400, latency_p99: 600 },
+            'claude-3-5-sonnet': { calls: 20, tokens_in: 2000, tokens_out: 1000, latency_p50: 500, latency_p95: 1000, latency_p99: 1500 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.correlationSummary.totalRuntimeModels).toBe(3);
+    });
+    it('identifies matched provider:model pairs', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+          makeCallsite({ provider: 'openai', model: 'gpt-4o-mini' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+            'gpt-4o-mini': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 200, latency_p95: 400, latency_p99: 600 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.correlationSummary.matched).toBe(2);
+    });
+  });
+  // =============================================================================
+  // EDGE CASES
+  // =============================================================================
+  describe('edge cases', () => {
+    it('handles empty callsites', async () => {
+      const input = makeInput({
+        callsites: [],
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.correlationSummary.totalCodeCallsites).toBe(0);
+      expect(result.correlationSummary.codeOnly).toBe(0);
+    });
+    it('handles empty runtime summary', async () => {
+      const input = makeInput({
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {},
+          byProvider: {},
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.correlationSummary.totalRuntimeModels).toBe(0);
+      expect(result.correlationSummary.runtimeOnly).toBe(0);
+    });
+    it('handles both empty', async () => {
+      const input = makeInput({
+        callsites: [],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {},
+          byProvider: {},
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Empty inputs should not crash; alignment interpretation varies (LLM vs fallback)
+      expect(result.alignmentScore).toBeGreaterThanOrEqual(0);
+      expect(result.alignmentScore).toBeLessThanOrEqual(1);
+    });
+    it('handles callsites with null provider/model', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: null, model: null }),
+        ],
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Should not crash, but callsite won't be matchable
+      expect(result).toBeDefined();
+    });
+    it('handles unknown provider inference from model name', async () => {
+      const input = makeInput({
+        callsites: [],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'llama-70b': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Should handle unknown provider gracefully
+      expect(result.correlationSummary.totalRuntimeModels).toBe(1);
+    });
+  });
+  // =============================================================================
+  // ALIGNMENT SCORE TESTS
+  // =============================================================================
+  describe('alignment score calculation', () => {
+    it('returns 1.0 for perfect match', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.alignmentScore).toBe(1.0);
+    });
+    it('returns low score for complete mismatch', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'claude-3-opus': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 500, latency_p95: 1000, latency_p99: 1500 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Complete mismatch should result in low alignment score (LLM may score differently than fallback)
+      expect(result.alignmentScore).toBeLessThanOrEqual(0.5);
+    });
+    it('returns intermediate score for partial match', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+          makeCallsite({ provider: 'anthropic', model: 'claude-3-opus' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+            'gpt-4o-mini': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 200, latency_p95: 400, latency_p99: 600 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // 1 match out of 3 unique provider:model pairs (2 code + 2 runtime, 1 overlap)
+      // Expected: (1 * 2) / 4 = 0.5
+      expect(result.alignmentScore).toBeGreaterThan(0);
+      expect(result.alignmentScore).toBeLessThan(1);
+    });
+  });
+  // =============================================================================
+  // DRIFT SIGNAL TESTS
+  // =============================================================================
+  describe('drift signal generation', () => {
+    it('generates drift signals for code/runtime mismatch', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ id: 'cs_orphan', provider: 'anthropic', model: 'claude-3-opus' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Should detect drift - either as codeOnly, runtimeOnly, or mismatch depending on LLM
+      expect(result.driftSignals.length + result.correlationSummary.codeOnly + result.correlationSummary.runtimeOnly).toBeGreaterThan(0);
+    });
+    it('generates runtimeOnly drift signal with correct fields', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+            'claude-3-opus': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 500, latency_p95: 1000, latency_p99: 1500 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      const runtimeOnlySignal = result.driftSignals.find(s => s.type === 'runtimeOnly');
+      expect(runtimeOnlySignal).toBeDefined();
+      expect(runtimeOnlySignal?.model).toBe('claude-3-opus');
+      expect(runtimeOnlySignal?.message).toBeDefined();
+    });
+    it('does not generate drift signals when fully aligned', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.driftSignals).toHaveLength(0);
+    });
+  });
+  // =============================================================================
+  // INSIGHTS VALIDATION (when LLM is available)
+  // =============================================================================
+  describe('insights structure', () => {
+    it('insights have required fields when generated', async () => {
+      const input = makeInput({
+        callsites: [
+          makeCallsite({ provider: 'anthropic', model: 'claude-3-opus' }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Insights may be empty in fallback mode, but if present, must have structure
+      for (const insight of result.insights) {
+        expect(insight).toHaveProperty('id');
+        expect(insight).toHaveProperty('severity');
+        expect(insight).toHaveProperty('category');
+        expect(insight).toHaveProperty('headline');
+        expect(insight).toHaveProperty('evidence');
+        expect(['critical', 'warning', 'info']).toContain(insight.severity);
+      }
+    });
+  });
+});