npm - @peakinfer/cli - Versions diffs - 1.0.133 - Mend

@peakinfer/cli 1.0.133

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (367) hide show

package/.claude/settings.local.json +8 -0
package/.env.example +6 -0
package/.github/workflows/peakinfer.yml +64 -0
package/CHANGELOG.md +31 -0
package/LICENSE +190 -0
package/README.md +335 -0
package/data/inferencemax.json +274 -0
package/dist/agent-analyzer.d.ts +45 -0
package/dist/agent-analyzer.d.ts.map +1 -0
package/dist/agent-analyzer.js +374 -0
package/dist/agent-analyzer.js.map +1 -0
package/dist/agent.d.ts +76 -0
package/dist/agent.d.ts.map +1 -0
package/dist/agent.js +965 -0
package/dist/agent.js.map +1 -0
package/dist/agents/correlation-analyzer.d.ts +34 -0
package/dist/agents/correlation-analyzer.d.ts.map +1 -0
package/dist/agents/correlation-analyzer.js +261 -0
package/dist/agents/correlation-analyzer.js.map +1 -0
package/dist/agents/index.d.ts +91 -0
package/dist/agents/index.d.ts.map +1 -0
package/dist/agents/index.js +111 -0
package/dist/agents/index.js.map +1 -0
package/dist/agents/runtime-analyzer.d.ts +38 -0
package/dist/agents/runtime-analyzer.d.ts.map +1 -0
package/dist/agents/runtime-analyzer.js +244 -0
package/dist/agents/runtime-analyzer.js.map +1 -0
package/dist/analysis-types.d.ts +500 -0
package/dist/analysis-types.d.ts.map +1 -0
package/dist/analysis-types.js +11 -0
package/dist/analysis-types.js.map +1 -0
package/dist/analytics.d.ts +25 -0
package/dist/analytics.d.ts.map +1 -0
package/dist/analytics.js +94 -0
package/dist/analytics.js.map +1 -0
package/dist/analyzer.d.ts +48 -0
package/dist/analyzer.d.ts.map +1 -0
package/dist/analyzer.js +547 -0
package/dist/analyzer.js.map +1 -0
package/dist/artifacts.d.ts +44 -0
package/dist/artifacts.d.ts.map +1 -0
package/dist/artifacts.js +165 -0
package/dist/artifacts.js.map +1 -0
package/dist/benchmarks/index.d.ts +88 -0
package/dist/benchmarks/index.d.ts.map +1 -0
package/dist/benchmarks/index.js +205 -0
package/dist/benchmarks/index.js.map +1 -0
package/dist/cli.d.ts +3 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +427 -0
package/dist/cli.js.map +1 -0
package/dist/commands/ci.d.ts +19 -0
package/dist/commands/ci.d.ts.map +1 -0
package/dist/commands/ci.js +253 -0
package/dist/commands/ci.js.map +1 -0
package/dist/commands/config.d.ts +16 -0
package/dist/commands/config.d.ts.map +1 -0
package/dist/commands/config.js +249 -0
package/dist/commands/config.js.map +1 -0
package/dist/commands/demo.d.ts +15 -0
package/dist/commands/demo.d.ts.map +1 -0
package/dist/commands/demo.js +106 -0
package/dist/commands/demo.js.map +1 -0
package/dist/commands/export.d.ts +14 -0
package/dist/commands/export.d.ts.map +1 -0
package/dist/commands/export.js +209 -0
package/dist/commands/export.js.map +1 -0
package/dist/commands/history.d.ts +15 -0
package/dist/commands/history.d.ts.map +1 -0
package/dist/commands/history.js +389 -0
package/dist/commands/history.js.map +1 -0
package/dist/commands/template.d.ts +14 -0
package/dist/commands/template.d.ts.map +1 -0
package/dist/commands/template.js +341 -0
package/dist/commands/template.js.map +1 -0
package/dist/commands/validate-map.d.ts +12 -0
package/dist/commands/validate-map.d.ts.map +1 -0
package/dist/commands/validate-map.js +274 -0
package/dist/commands/validate-map.js.map +1 -0
package/dist/commands/whatif.d.ts +17 -0
package/dist/commands/whatif.d.ts.map +1 -0
package/dist/commands/whatif.js +206 -0
package/dist/commands/whatif.js.map +1 -0
package/dist/comparison.d.ts +38 -0
package/dist/comparison.d.ts.map +1 -0
package/dist/comparison.js +223 -0
package/dist/comparison.js.map +1 -0
package/dist/config.d.ts +42 -0
package/dist/config.d.ts.map +1 -0
package/dist/config.js +158 -0
package/dist/config.js.map +1 -0
package/dist/connectors/helicone.d.ts +9 -0
package/dist/connectors/helicone.d.ts.map +1 -0
package/dist/connectors/helicone.js +106 -0
package/dist/connectors/helicone.js.map +1 -0
package/dist/connectors/index.d.ts +37 -0
package/dist/connectors/index.d.ts.map +1 -0
package/dist/connectors/index.js +65 -0
package/dist/connectors/index.js.map +1 -0
package/dist/connectors/langsmith.d.ts +9 -0
package/dist/connectors/langsmith.d.ts.map +1 -0
package/dist/connectors/langsmith.js +122 -0
package/dist/connectors/langsmith.js.map +1 -0
package/dist/connectors/types.d.ts +83 -0
package/dist/connectors/types.d.ts.map +1 -0
package/dist/connectors/types.js +98 -0
package/dist/connectors/types.js.map +1 -0
package/dist/cost-estimator.d.ts +46 -0
package/dist/cost-estimator.d.ts.map +1 -0
package/dist/cost-estimator.js +104 -0
package/dist/cost-estimator.js.map +1 -0
package/dist/costs.d.ts +57 -0
package/dist/costs.d.ts.map +1 -0
package/dist/costs.js +251 -0
package/dist/costs.js.map +1 -0
package/dist/counterfactuals.d.ts +29 -0
package/dist/counterfactuals.d.ts.map +1 -0
package/dist/counterfactuals.js +448 -0
package/dist/counterfactuals.js.map +1 -0
package/dist/enhancement-prompts.d.ts +41 -0
package/dist/enhancement-prompts.d.ts.map +1 -0
package/dist/enhancement-prompts.js +88 -0
package/dist/enhancement-prompts.js.map +1 -0
package/dist/envelopes.d.ts +20 -0
package/dist/envelopes.d.ts.map +1 -0
package/dist/envelopes.js +790 -0
package/dist/envelopes.js.map +1 -0
package/dist/format-normalizer.d.ts +71 -0
package/dist/format-normalizer.d.ts.map +1 -0
package/dist/format-normalizer.js +1331 -0
package/dist/format-normalizer.js.map +1 -0
package/dist/history.d.ts +79 -0
package/dist/history.d.ts.map +1 -0
package/dist/history.js +313 -0
package/dist/history.js.map +1 -0
package/dist/html.d.ts +11 -0
package/dist/html.d.ts.map +1 -0
package/dist/html.js +463 -0
package/dist/html.js.map +1 -0
package/dist/impact.d.ts +42 -0
package/dist/impact.d.ts.map +1 -0
package/dist/impact.js +443 -0
package/dist/impact.js.map +1 -0
package/dist/index.d.ts +26 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +34 -0
package/dist/index.js.map +1 -0
package/dist/insights.d.ts +5 -0
package/dist/insights.d.ts.map +1 -0
package/dist/insights.js +271 -0
package/dist/insights.js.map +1 -0
package/dist/joiner.d.ts +9 -0
package/dist/joiner.d.ts.map +1 -0
package/dist/joiner.js +247 -0
package/dist/joiner.js.map +1 -0
package/dist/orchestrator.d.ts +34 -0
package/dist/orchestrator.d.ts.map +1 -0
package/dist/orchestrator.js +827 -0
package/dist/orchestrator.js.map +1 -0
package/dist/pdf.d.ts +26 -0
package/dist/pdf.d.ts.map +1 -0
package/dist/pdf.js +84 -0
package/dist/pdf.js.map +1 -0
package/dist/prediction.d.ts +33 -0
package/dist/prediction.d.ts.map +1 -0
package/dist/prediction.js +316 -0
package/dist/prediction.js.map +1 -0
package/dist/prompts/loader.d.ts +38 -0
package/dist/prompts/loader.d.ts.map +1 -0
package/dist/prompts/loader.js +60 -0
package/dist/prompts/loader.js.map +1 -0
package/dist/renderer.d.ts +64 -0
package/dist/renderer.d.ts.map +1 -0
package/dist/renderer.js +923 -0
package/dist/renderer.js.map +1 -0
package/dist/runid.d.ts +57 -0
package/dist/runid.d.ts.map +1 -0
package/dist/runid.js +199 -0
package/dist/runid.js.map +1 -0
package/dist/runtime.d.ts +29 -0
package/dist/runtime.d.ts.map +1 -0
package/dist/runtime.js +366 -0
package/dist/runtime.js.map +1 -0
package/dist/scanner.d.ts +11 -0
package/dist/scanner.d.ts.map +1 -0
package/dist/scanner.js +426 -0
package/dist/scanner.js.map +1 -0
package/dist/templates.d.ts +120 -0
package/dist/templates.d.ts.map +1 -0
package/dist/templates.js +429 -0
package/dist/templates.js.map +1 -0
package/dist/tools/index.d.ts +153 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +177 -0
package/dist/tools/index.js.map +1 -0
package/dist/types.d.ts +3647 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +703 -0
package/dist/types.js.map +1 -0
package/dist/version.d.ts +7 -0
package/dist/version.d.ts.map +1 -0
package/dist/version.js +23 -0
package/dist/version.js.map +1 -0
package/docs/demo-guide.md +423 -0
package/docs/events-format.md +295 -0
package/docs/inferencemap-spec.md +344 -0
package/docs/migration-v2.md +293 -0
package/fixtures/demo/precomputed.json +142 -0
package/fixtures/demo-project/README.md +52 -0
package/fixtures/demo-project/ai-service.ts +65 -0
package/fixtures/demo-project/sample-events.jsonl +15 -0
package/fixtures/demo-project/src/ai-service.ts +128 -0
package/fixtures/demo-project/src/llm-client.ts +155 -0
package/package.json +65 -0
package/prompts/agent-analyzer.yaml +47 -0
package/prompts/ci-gate.yaml +98 -0
package/prompts/correlation-analyzer.yaml +178 -0
package/prompts/format-normalizer.yaml +46 -0
package/prompts/peak-performance.yaml +180 -0
package/prompts/pr-comment.yaml +111 -0
package/prompts/runtime-analyzer.yaml +189 -0
package/prompts/unified-analyzer.yaml +241 -0
package/schemas/inference-map.v0.1.json +215 -0
package/scripts/benchmark.ts +394 -0
package/scripts/demo-v1.5.sh +158 -0
package/scripts/sync-from-site.sh +197 -0
package/scripts/validate-sync.sh +178 -0
package/src/agent-analyzer.ts +481 -0
package/src/agent.ts +1232 -0
package/src/agents/correlation-analyzer.ts +353 -0
package/src/agents/index.ts +235 -0
package/src/agents/runtime-analyzer.ts +343 -0
package/src/analysis-types.ts +558 -0
package/src/analytics.ts +100 -0
package/src/analyzer.ts +692 -0
package/src/artifacts.ts +218 -0
package/src/benchmarks/index.ts +309 -0
package/src/cli.ts +503 -0
package/src/commands/ci.ts +336 -0
package/src/commands/config.ts +288 -0
package/src/commands/demo.ts +175 -0
package/src/commands/export.ts +297 -0
package/src/commands/history.ts +425 -0
package/src/commands/template.ts +385 -0
package/src/commands/validate-map.ts +324 -0
package/src/commands/whatif.ts +272 -0
package/src/comparison.ts +283 -0
package/src/config.ts +188 -0
package/src/connectors/helicone.ts +164 -0
package/src/connectors/index.ts +93 -0
package/src/connectors/langsmith.ts +179 -0
package/src/connectors/types.ts +180 -0
package/src/cost-estimator.ts +146 -0
package/src/costs.ts +347 -0
package/src/counterfactuals.ts +516 -0
package/src/enhancement-prompts.ts +118 -0
package/src/envelopes.ts +814 -0
package/src/format-normalizer.ts +1486 -0
package/src/history.ts +400 -0
package/src/html.ts +512 -0
package/src/impact.ts +522 -0
package/src/index.ts +83 -0
package/src/insights.ts +341 -0
package/src/joiner.ts +289 -0
package/src/orchestrator.ts +1015 -0
package/src/pdf.ts +110 -0
package/src/prediction.ts +392 -0
package/src/prompts/loader.ts +88 -0
package/src/renderer.ts +1045 -0
package/src/runid.ts +261 -0
package/src/runtime.ts +450 -0
package/src/scanner.ts +508 -0
package/src/templates.ts +561 -0
package/src/tools/index.ts +214 -0
package/src/types.ts +873 -0
package/src/version.ts +24 -0
package/templates/context-accumulation.yaml +23 -0
package/templates/cost-concentration.yaml +20 -0
package/templates/dead-code.yaml +20 -0
package/templates/latency-explainer.yaml +23 -0
package/templates/optimizations/ab-testing-framework.yaml +74 -0
package/templates/optimizations/api-gateway-optimization.yaml +81 -0
package/templates/optimizations/api-model-routing-strategy.yaml +126 -0
package/templates/optimizations/auto-scaling-optimization.yaml +85 -0
package/templates/optimizations/batch-utilization-diagnostic.yaml +142 -0
package/templates/optimizations/comprehensive-apm.yaml +76 -0
package/templates/optimizations/context-window-optimization.yaml +91 -0
package/templates/optimizations/cost-sensitive-batch-processing.yaml +77 -0
package/templates/optimizations/distributed-training-optimization.yaml +77 -0
package/templates/optimizations/document-analysis-edge.yaml +77 -0
package/templates/optimizations/document-pipeline-optimization.yaml +78 -0
package/templates/optimizations/domain-specific-distillation.yaml +78 -0
package/templates/optimizations/error-handling-optimization.yaml +76 -0
package/templates/optimizations/gptq-4bit-quantization.yaml +96 -0
package/templates/optimizations/long-context-memory-management.yaml +78 -0
package/templates/optimizations/max-tokens-optimization.yaml +76 -0
package/templates/optimizations/memory-bandwidth-optimization.yaml +73 -0
package/templates/optimizations/multi-framework-resilience.yaml +75 -0
package/templates/optimizations/multi-tenant-optimization.yaml +75 -0
package/templates/optimizations/prompt-caching-optimization.yaml +143 -0
package/templates/optimizations/pytorch-to-onnx-migration.yaml +109 -0
package/templates/optimizations/quality-monitoring.yaml +74 -0
package/templates/optimizations/realtime-budget-controls.yaml +74 -0
package/templates/optimizations/realtime-latency-optimization.yaml +74 -0
package/templates/optimizations/sglang-concurrency-optimization.yaml +78 -0
package/templates/optimizations/smart-model-routing.yaml +96 -0
package/templates/optimizations/streaming-batch-selection.yaml +167 -0
package/templates/optimizations/system-prompt-optimization.yaml +75 -0
package/templates/optimizations/tensorrt-llm-performance.yaml +77 -0
package/templates/optimizations/vllm-high-throughput-optimization.yaml +93 -0
package/templates/optimizations/vllm-migration-memory-bound.yaml +78 -0
package/templates/overpowered-extraction.yaml +32 -0
package/templates/overpowered-model.yaml +31 -0
package/templates/prompt-bloat.yaml +24 -0
package/templates/retry-explosion.yaml +28 -0
package/templates/schema/insight.schema.json +113 -0
package/templates/schema/optimization.schema.json +180 -0
package/templates/streaming-drift.yaml +30 -0
package/templates/throughput-gap.yaml +21 -0
package/templates/token-underutilization.yaml +28 -0
package/templates/untested-fallback.yaml +21 -0
package/tests/accuracy/drift-detection.test.ts +184 -0
package/tests/accuracy/false-positives.test.ts +166 -0
package/tests/accuracy/templates.test.ts +205 -0
package/tests/action/commands.test.ts +125 -0
package/tests/action/comments.test.ts +347 -0
package/tests/cli.test.ts +203 -0
package/tests/comparison.test.ts +309 -0
package/tests/correlation-analyzer.test.ts +534 -0
package/tests/counterfactuals.test.ts +347 -0
package/tests/fixtures/events/missing-id.jsonl +1 -0
package/tests/fixtures/events/missing-input.jsonl +1 -0
package/tests/fixtures/events/missing-latency.jsonl +1 -0
package/tests/fixtures/events/missing-model.jsonl +1 -0
package/tests/fixtures/events/missing-output.jsonl +1 -0
package/tests/fixtures/events/missing-provider.jsonl +1 -0
package/tests/fixtures/events/missing-ts.jsonl +1 -0
package/tests/fixtures/events/valid.csv +3 -0
package/tests/fixtures/events/valid.json +1 -0
package/tests/fixtures/events/valid.jsonl +2 -0
package/tests/fixtures/events/with-callsite.jsonl +1 -0
package/tests/fixtures/events/with-intent.jsonl +1 -0
package/tests/fixtures/events/wrong-type.jsonl +1 -0
package/tests/fixtures/repos/empty/.gitkeep +0 -0
package/tests/fixtures/repos/hybrid-router/router.py +35 -0
package/tests/fixtures/repos/saas-anthropic/agent.ts +27 -0
package/tests/fixtures/repos/saas-openai/assistant.js +33 -0
package/tests/fixtures/repos/saas-openai/client.py +26 -0
package/tests/fixtures/repos/self-hosted-vllm/inference.py +22 -0
package/tests/github-action.test.ts +292 -0
package/tests/insights.test.ts +878 -0
package/tests/joiner.test.ts +168 -0
package/tests/performance/action-latency.test.ts +132 -0
package/tests/performance/benchmark.test.ts +189 -0
package/tests/performance/cli-latency.test.ts +102 -0
package/tests/pr-comment.test.ts +313 -0
package/tests/prediction.test.ts +296 -0
package/tests/runtime-analyzer.test.ts +375 -0
package/tests/runtime.test.ts +205 -0
package/tests/scanner.test.ts +122 -0
package/tests/template-conformance.test.ts +526 -0
package/tests/unit/cost-calculator.test.ts +303 -0
package/tests/unit/credits.test.ts +180 -0
package/tests/unit/inference-map.test.ts +276 -0
package/tests/unit/schema.test.ts +300 -0
package/tsconfig.json +20 -0
package/vitest.config.ts +14 -0

package/tests/counterfactuals.test.ts ADDED Viewed

@@ -0,0 +1,347 @@
+import { describe, it, expect } from 'vitest';
+import {
+  generateCounterfactuals,
+  formatCounterfactualSummary,
+  hasSignificantOpportunities,
+  rankCounterfactuals,
+} from '../src/counterfactuals.js';
+import type { Callsite, InferenceMap } from '../src/types.js';
+// =============================================================================
+// TEST FIXTURES
+// =============================================================================
+function createCallsite(overrides: Partial<Callsite> = {}): Callsite {
+  return {
+    id: `cs_${Date.now()}_${Math.random().toString(36).slice(2, 6)}`,
+    file: 'src/agent.ts',
+    line: 42,
+    col: 10,
+    provider: 'openai',
+    model: 'gpt-4o',
+    framework: null,
+    runtime: null,
+    patterns: {},
+    confidence: 0.9,
+    ...overrides,
+  };
+}
+function createInferenceMap(callsites: Callsite[]): InferenceMap {
+  return {
+    version: '0.1',
+    callsites,
+    frameworks: {},
+    scanResult: {
+      root: '/test',
+      files: [],
+      summary: { totalFiles: 0, totalLoc: 0, languages: [], totalCandidates: 0 },
+    },
+  };
+}
+// =============================================================================
+// TESTS
+// =============================================================================
+describe('counterfactuals', () => {
+  describe('generateCounterfactuals', () => {
+    it('should generate model swap counterfactuals for GPT-4', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4' }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const modelSwaps = result.counterfactuals.filter(cf => cf.type === 'model_swap');
+      expect(modelSwaps.length).toBeGreaterThan(0);
+      // Should suggest gpt-4o and gpt-4o-mini as alternatives
+      const suggestedModels = modelSwaps.map(cf => cf.proposedState.model);
+      expect(suggestedModels).toContain('gpt-4o');
+    });
+    it('should generate model swap counterfactuals for Claude Opus', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'claude-3-opus' }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const modelSwaps = result.counterfactuals.filter(cf => cf.type === 'model_swap');
+      expect(modelSwaps.length).toBeGreaterThan(0);
+      // Should suggest Claude Sonnet/Haiku as alternatives
+      const suggestedModels = modelSwaps.map(cf => cf.proposedState.model);
+      expect(suggestedModels.some(m => m.includes('sonnet') || m.includes('haiku'))).toBe(true);
+    });
+    it('should generate batching counterfactuals for multiple unbatched callsites', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4o', patterns: {} }),
+        createCallsite({ file: 'src/b.ts', line: 20, model: 'gpt-4o', patterns: {} }),
+        createCallsite({ file: 'src/c.ts', line: 30, model: 'gpt-4o', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const batchingCfs = result.counterfactuals.filter(cf => cf.type === 'batch_optimization');
+      expect(batchingCfs.length).toBeGreaterThan(0);
+    });
+    it('should not generate batching counterfactuals for single callsite', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4o', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const batchingCfs = result.counterfactuals.filter(cf => cf.type === 'batch_optimization');
+      expect(batchingCfs.length).toBe(0);
+    });
+    it('should generate caching counterfactuals for uncached callsites', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const cachingCfs = result.counterfactuals.filter(cf => cf.type === 'cache_addition');
+      expect(cachingCfs.length).toBe(1);
+    });
+    it('should not generate caching counterfactuals for cached callsites', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, patterns: { caching: true } }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const cachingCfs = result.counterfactuals.filter(cf => cf.type === 'cache_addition');
+      expect(cachingCfs.length).toBe(0);
+    });
+    it('should generate streaming counterfactuals for non-streaming callsites', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const streamingCfs = result.counterfactuals.filter(cf => cf.type === 'streaming_enable');
+      expect(streamingCfs.length).toBe(1);
+    });
+    it('should not generate streaming counterfactuals for streaming callsites', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, patterns: { streaming: true } }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const streamingCfs = result.counterfactuals.filter(cf => cf.type === 'streaming_enable');
+      expect(streamingCfs.length).toBe(0);
+    });
+    it('should calculate impact for each counterfactual', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      for (const cf of result.counterfactuals) {
+        expect(cf.impact).toBeDefined();
+        expect(cf.impact.latencyDeltaPercent).toBeDefined();
+        expect(cf.impact.costDeltaPercent).toBeDefined();
+      }
+    });
+    it('should include tradeoffs for each counterfactual', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      for (const cf of result.counterfactuals) {
+        expect(cf.impact.tradeoffs).toBeDefined();
+        expect(Array.isArray(cf.impact.tradeoffs)).toBe(true);
+      }
+    });
+    it('should handle empty inference map', () => {
+      const inferenceMap = createInferenceMap([]);
+      const result = generateCounterfactuals(inferenceMap);
+      expect(result.counterfactuals.length).toBe(0);
+      expect(result.summary.totalOpportunities).toBe(0);
+    });
+    it('should calculate summary correctly', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      expect(result.summary.totalOpportunities).toBe(result.counterfactuals.length);
+      expect(result.summary.maxLatencySavingsPercent).toBeGreaterThanOrEqual(0);
+    });
+    it('should include affected points for each counterfactual', () => {
+      const callsite1 = createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4' });
+      const inferenceMap = createInferenceMap([callsite1]);
+      const result = generateCounterfactuals(inferenceMap);
+      for (const cf of result.counterfactuals) {
+        expect(cf.affectedPoints).toBeDefined();
+        expect(Array.isArray(cf.affectedPoints)).toBe(true);
+      }
+    });
+  });
+  describe('formatCounterfactualSummary', () => {
+    it('should format summary with opportunity count', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const summary = formatCounterfactualSummary(result);
+      expect(summary).toContain('optimization opportunities');
+    });
+    it('should include latency savings in summary', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const summary = formatCounterfactualSummary(result);
+      expect(summary).toContain('latency savings');
+    });
+  });
+  describe('hasSignificantOpportunities', () => {
+    it('should return true when high-impact opportunities exist', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      expect(hasSignificantOpportunities(result)).toBe(true);
+    });
+    it('should return false when no opportunities', () => {
+      const inferenceMap = createInferenceMap([]);
+      const result = generateCounterfactuals(inferenceMap);
+      expect(hasSignificantOpportunities(result)).toBe(false);
+    });
+  });
+  describe('rankCounterfactuals', () => {
+    it('should rank by latency when priority is latency', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+        createCallsite({ file: 'src/b.ts', line: 20, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const ranked = rankCounterfactuals(result, 'latency');
+      // Should be sorted by latency delta (most negative first)
+      for (let i = 1; i < ranked.length; i++) {
+        expect(ranked[i].impact.latencyDeltaPercent)
+          .toBeGreaterThanOrEqual(ranked[i - 1].impact.latencyDeltaPercent);
+      }
+    });
+    it('should rank by cost when priority is cost', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+        createCallsite({ file: 'src/b.ts', line: 20, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const ranked = rankCounterfactuals(result, 'cost');
+      // Should be sorted by cost delta (most negative first)
+      for (let i = 1; i < ranked.length; i++) {
+        expect(ranked[i].impact.costDeltaPercent)
+          .toBeGreaterThanOrEqual(ranked[i - 1].impact.costDeltaPercent);
+      }
+    });
+    it('should rank by combined score when priority is balanced', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4', patterns: {} }),
+        createCallsite({ file: 'src/b.ts', line: 20, model: 'gpt-4', patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const ranked = rankCounterfactuals(result, 'balanced');
+      // Should be sorted by combined score (latency + cost)
+      for (let i = 1; i < ranked.length; i++) {
+        const scorePrev = ranked[i - 1].impact.latencyDeltaPercent + ranked[i - 1].impact.costDeltaPercent;
+        const scoreCurr = ranked[i].impact.latencyDeltaPercent + ranked[i].impact.costDeltaPercent;
+        expect(scoreCurr).toBeGreaterThanOrEqual(scorePrev);
+      }
+    });
+  });
+  describe('counterfactual types', () => {
+    it('should generate model_swap with correct structure', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, model: 'gpt-4' }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const modelSwap = result.counterfactuals.find(cf => cf.type === 'model_swap');
+      expect(modelSwap).toBeDefined();
+      expect(modelSwap?.currentState.model).toBe('gpt-4');
+      expect(modelSwap?.proposedState.model).toBeDefined();
+      expect(modelSwap?.confidence).toBeDefined();
+      expect(modelSwap?.effort).toBeDefined();
+    });
+    it('should generate cache_addition with correct structure', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const caching = result.counterfactuals.find(cf => cf.type === 'cache_addition');
+      expect(caching).toBeDefined();
+      expect(caching?.currentState.pattern).toBe('no caching');
+      expect(caching?.proposedState.pattern).toBe('semantic cache');
+      expect(caching?.impact.costDeltaPercent).toBe(-50);
+    });
+    it('should generate streaming_enable with correct structure', () => {
+      const inferenceMap = createInferenceMap([
+        createCallsite({ file: 'src/a.ts', line: 10, patterns: {} }),
+      ]);
+      const result = generateCounterfactuals(inferenceMap);
+      const streaming = result.counterfactuals.find(cf => cf.type === 'streaming_enable');
+      expect(streaming).toBeDefined();
+      expect(streaming?.currentState.pattern).toBe('synchronous');
+      expect(streaming?.proposedState.pattern).toBe('streaming');
+      expect(streaming?.impact.latencyDeltaPercent).toBe(-80);
+      expect(streaming?.impact.costDeltaPercent).toBe(0); // Streaming doesn't affect cost
+    });
+  });
+});

package/tests/fixtures/events/missing-id.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}

package/tests/fixtures/events/missing-input.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","output_tokens":50,"latency_ms":420}

package/tests/fixtures/events/missing-latency.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50}

package/tests/fixtures/events/missing-model.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01","provider":"openai","input_tokens":100,"output_tokens":50,"latency_ms":420}

package/tests/fixtures/events/missing-output.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"latency_ms":420}

package/tests/fixtures/events/missing-provider.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}

package/tests/fixtures/events/missing-ts.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}

package/tests/fixtures/events/valid.csv ADDED Viewed

@@ -0,0 +1,3 @@
+id,ts,provider,model,input_tokens,output_tokens,latency_ms
+1,2024-01-01T00:00:00Z,openai,gpt-4o,100,50,420
+2,2024-01-01T00:01:00Z,openai,gpt-4o,200,80,580

package/tests/fixtures/events/valid.json ADDED Viewed

	@@ -0,0 +1 @@
1	+ [{"id":"1","ts":"2024-01-01T00:00:00Z","provider":"anthropic","model":"claude-3-sonnet-20240229","input_tokens":150,"output_tokens":60,"latency_ms":350},{"id":"2","ts":"2024-01-01T00:01:00Z","provider":"anthropic","model":"claude-3-sonnet-20240229","input_tokens":180,"output_tokens":90,"latency_ms":400}]

package/tests/fixtures/events/valid.jsonl ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ {"id":"1","ts":"2024-01-01T00:00:00Z","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}
2	+ {"id":"2","ts":"2024-01-01T00:01:00Z","provider":"openai","model":"gpt-4o","input_tokens":200,"output_tokens":80,"latency_ms":580}

package/tests/fixtures/events/with-callsite.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01T00:00:00Z","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420,"callsite_id":"cs_001"}

package/tests/fixtures/events/with-intent.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01T00:00:00Z","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420,"intent":"chat"}

package/tests/fixtures/events/wrong-type.jsonl ADDED Viewed

	@@ -0,0 +1 @@
1	+ {"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":"fast"}

package/tests/fixtures/repos/empty/.gitkeep ADDED Viewed

File without changes

package/tests/fixtures/repos/hybrid-router/router.py ADDED Viewed

@@ -0,0 +1,35 @@
+from openai import OpenAI
+from anthropic import Anthropic
+import os
+openai_client = OpenAI()
+anthropic_client = Anthropic()
+PROVIDER = os.getenv("LLM_PROVIDER", "openai")
+def route_completion(prompt: str, use_cache: bool = True) -> str:
+    if PROVIDER == "anthropic":
+        return _anthropic_completion(prompt)
+    return _openai_completion(prompt)
+def _openai_completion(prompt: str) -> str:
+    response = openai_client.chat.completions.create(
+        model="gpt-4o",
+        messages=[{"role": "user", "content": prompt}],
+        stream=True
+    )
+    return response.choices[0].message.content
+def _anthropic_completion(prompt: str) -> str:
+    response = anthropic_client.messages.create(
+        model="claude-3-sonnet-20240229",
+        max_tokens=1024,
+        messages=[{"role": "user", "content": prompt}]
+    )
+    return response.content[0].text
+def with_fallback(prompt: str) -> str:
+    try:
+        return _openai_completion(prompt)
+    except Exception:
+        return _anthropic_completion(prompt)

package/tests/fixtures/repos/saas-anthropic/agent.ts ADDED Viewed

@@ -0,0 +1,27 @@
+import Anthropic from "@anthropic-ai/sdk";
+const client = new Anthropic();
+export async function runAgent(query: string): Promise<string> {
+  const response = await client.messages.create({
+    model: "claude-3-sonnet-20240229",
+    max_tokens: 1024,
+    messages: [{ role: "user", content: query }],
+  });
+  return response.content[0].type === "text" ? response.content[0].text : "";
+}
+export async function streamResponse(query: string): AsyncGenerator<string> {
+  const stream = await client.messages.stream({
+    model: "claude-3-opus-20240229",
+    max_tokens: 4096,
+    messages: [{ role: "user", content: query }],
+  });
+  for await (const chunk of stream) {
+    if (chunk.type === "content_block_delta") {
+      yield chunk.delta.text;
+    }
+  }
+}

package/tests/fixtures/repos/saas-openai/assistant.js ADDED Viewed

@@ -0,0 +1,33 @@
+const OpenAI = require('openai');
+const client = new OpenAI();
+async function chat(userMessage) {
+  const response = await client.chat.completions.create({
+    model: 'gpt-4o',
+    messages: [
+      { role: 'system', content: 'You are a helpful assistant.' },
+      { role: 'user', content: userMessage }
+    ],
+    stream: true
+  });
+  let fullResponse = '';
+  for await (const chunk of response) {
+    const delta = chunk.choices[0]?.delta?.content || '';
+    fullResponse += delta;
+    process.stdout.write(delta);
+  }
+  return fullResponse;
+}
+async function embed(text) {
+  const response = await client.embeddings.create({
+    model: 'text-embedding-ada-002',
+    input: text
+  });
+  return response.data[0].embedding;
+}
+module.exports = { chat, embed };

package/tests/fixtures/repos/saas-openai/client.py ADDED Viewed

@@ -0,0 +1,26 @@
+from openai import OpenAI
+client = OpenAI()
+def chat_completion(prompt: str) -> str:
+    response = client.chat.completions.create(
+        model="gpt-4o",
+        messages=[{"role": "user", "content": prompt}],
+        stream=True
+    )
+    return response.choices[0].message.content
+def batch_embeddings(texts: list[str]) -> list[list[float]]:
+    response = client.embeddings.create(
+        model="text-embedding-3-small",
+        input=texts
+    )
+    return [item.embedding for item in response.data]
+async def async_completion(prompt: str) -> str:
+    response = await client.chat.completions.create(
+        model="gpt-3.5-turbo",
+        messages=[{"role": "user", "content": prompt}],
+        max_retries=3
+    )
+    return response.choices[0].message.content

package/tests/fixtures/repos/self-hosted-vllm/inference.py ADDED Viewed

@@ -0,0 +1,22 @@
+from openai import OpenAI
+# vLLM OpenAI-compatible server
+client = OpenAI(
+    base_url="http://localhost:8000/v1",
+    api_key="dummy"
+)
+def generate(prompt: str, max_tokens: int = 512) -> str:
+    response = client.completions.create(
+        model="meta-llama/Llama-3-70b-chat-hf",
+        prompt=prompt,
+        max_tokens=max_tokens,
+        temperature=0.7
+    )
+    return response.choices[0].text
+def batch_generate(prompts: list[str]) -> list[str]:
+    results = []
+    for prompt in prompts:
+        results.append(generate(prompt))
+    return results