npm - @peakinfer/cli - Versions diffs - 1.0.133 - Mend

@peakinfer/cli 1.0.133

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (367) hide show

package/.claude/settings.local.json +8 -0
package/.env.example +6 -0
package/.github/workflows/peakinfer.yml +64 -0
package/CHANGELOG.md +31 -0
package/LICENSE +190 -0
package/README.md +335 -0
package/data/inferencemax.json +274 -0
package/dist/agent-analyzer.d.ts +45 -0
package/dist/agent-analyzer.d.ts.map +1 -0
package/dist/agent-analyzer.js +374 -0
package/dist/agent-analyzer.js.map +1 -0
package/dist/agent.d.ts +76 -0
package/dist/agent.d.ts.map +1 -0
package/dist/agent.js +965 -0
package/dist/agent.js.map +1 -0
package/dist/agents/correlation-analyzer.d.ts +34 -0
package/dist/agents/correlation-analyzer.d.ts.map +1 -0
package/dist/agents/correlation-analyzer.js +261 -0
package/dist/agents/correlation-analyzer.js.map +1 -0
package/dist/agents/index.d.ts +91 -0
package/dist/agents/index.d.ts.map +1 -0
package/dist/agents/index.js +111 -0
package/dist/agents/index.js.map +1 -0
package/dist/agents/runtime-analyzer.d.ts +38 -0
package/dist/agents/runtime-analyzer.d.ts.map +1 -0
package/dist/agents/runtime-analyzer.js +244 -0
package/dist/agents/runtime-analyzer.js.map +1 -0
package/dist/analysis-types.d.ts +500 -0
package/dist/analysis-types.d.ts.map +1 -0
package/dist/analysis-types.js +11 -0
package/dist/analysis-types.js.map +1 -0
package/dist/analytics.d.ts +25 -0
package/dist/analytics.d.ts.map +1 -0
package/dist/analytics.js +94 -0
package/dist/analytics.js.map +1 -0
package/dist/analyzer.d.ts +48 -0
package/dist/analyzer.d.ts.map +1 -0
package/dist/analyzer.js +547 -0
package/dist/analyzer.js.map +1 -0
package/dist/artifacts.d.ts +44 -0
package/dist/artifacts.d.ts.map +1 -0
package/dist/artifacts.js +165 -0
package/dist/artifacts.js.map +1 -0
package/dist/benchmarks/index.d.ts +88 -0
package/dist/benchmarks/index.d.ts.map +1 -0
package/dist/benchmarks/index.js +205 -0
package/dist/benchmarks/index.js.map +1 -0
package/dist/cli.d.ts +3 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +427 -0
package/dist/cli.js.map +1 -0
package/dist/commands/ci.d.ts +19 -0
package/dist/commands/ci.d.ts.map +1 -0
package/dist/commands/ci.js +253 -0
package/dist/commands/ci.js.map +1 -0
package/dist/commands/config.d.ts +16 -0
package/dist/commands/config.d.ts.map +1 -0
package/dist/commands/config.js +249 -0
package/dist/commands/config.js.map +1 -0
package/dist/commands/demo.d.ts +15 -0
package/dist/commands/demo.d.ts.map +1 -0
package/dist/commands/demo.js +106 -0
package/dist/commands/demo.js.map +1 -0
package/dist/commands/export.d.ts +14 -0
package/dist/commands/export.d.ts.map +1 -0
package/dist/commands/export.js +209 -0
package/dist/commands/export.js.map +1 -0
package/dist/commands/history.d.ts +15 -0
package/dist/commands/history.d.ts.map +1 -0
package/dist/commands/history.js +389 -0
package/dist/commands/history.js.map +1 -0
package/dist/commands/template.d.ts +14 -0
package/dist/commands/template.d.ts.map +1 -0
package/dist/commands/template.js +341 -0
package/dist/commands/template.js.map +1 -0
package/dist/commands/validate-map.d.ts +12 -0
package/dist/commands/validate-map.d.ts.map +1 -0
package/dist/commands/validate-map.js +274 -0
package/dist/commands/validate-map.js.map +1 -0
package/dist/commands/whatif.d.ts +17 -0
package/dist/commands/whatif.d.ts.map +1 -0
package/dist/commands/whatif.js +206 -0
package/dist/commands/whatif.js.map +1 -0
package/dist/comparison.d.ts +38 -0
package/dist/comparison.d.ts.map +1 -0
package/dist/comparison.js +223 -0
package/dist/comparison.js.map +1 -0
package/dist/config.d.ts +42 -0
package/dist/config.d.ts.map +1 -0
package/dist/config.js +158 -0
package/dist/config.js.map +1 -0
package/dist/connectors/helicone.d.ts +9 -0
package/dist/connectors/helicone.d.ts.map +1 -0
package/dist/connectors/helicone.js +106 -0
package/dist/connectors/helicone.js.map +1 -0
package/dist/connectors/index.d.ts +37 -0
package/dist/connectors/index.d.ts.map +1 -0
package/dist/connectors/index.js +65 -0
package/dist/connectors/index.js.map +1 -0
package/dist/connectors/langsmith.d.ts +9 -0
package/dist/connectors/langsmith.d.ts.map +1 -0
package/dist/connectors/langsmith.js +122 -0
package/dist/connectors/langsmith.js.map +1 -0
package/dist/connectors/types.d.ts +83 -0
package/dist/connectors/types.d.ts.map +1 -0
package/dist/connectors/types.js +98 -0
package/dist/connectors/types.js.map +1 -0
package/dist/cost-estimator.d.ts +46 -0
package/dist/cost-estimator.d.ts.map +1 -0
package/dist/cost-estimator.js +104 -0
package/dist/cost-estimator.js.map +1 -0
package/dist/costs.d.ts +57 -0
package/dist/costs.d.ts.map +1 -0
package/dist/costs.js +251 -0
package/dist/costs.js.map +1 -0
package/dist/counterfactuals.d.ts +29 -0
package/dist/counterfactuals.d.ts.map +1 -0
package/dist/counterfactuals.js +448 -0
package/dist/counterfactuals.js.map +1 -0
package/dist/enhancement-prompts.d.ts +41 -0
package/dist/enhancement-prompts.d.ts.map +1 -0
package/dist/enhancement-prompts.js +88 -0
package/dist/enhancement-prompts.js.map +1 -0
package/dist/envelopes.d.ts +20 -0
package/dist/envelopes.d.ts.map +1 -0
package/dist/envelopes.js +790 -0
package/dist/envelopes.js.map +1 -0
package/dist/format-normalizer.d.ts +71 -0
package/dist/format-normalizer.d.ts.map +1 -0
package/dist/format-normalizer.js +1331 -0
package/dist/format-normalizer.js.map +1 -0
package/dist/history.d.ts +79 -0
package/dist/history.d.ts.map +1 -0
package/dist/history.js +313 -0
package/dist/history.js.map +1 -0
package/dist/html.d.ts +11 -0
package/dist/html.d.ts.map +1 -0
package/dist/html.js +463 -0
package/dist/html.js.map +1 -0
package/dist/impact.d.ts +42 -0
package/dist/impact.d.ts.map +1 -0
package/dist/impact.js +443 -0
package/dist/impact.js.map +1 -0
package/dist/index.d.ts +26 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +34 -0
package/dist/index.js.map +1 -0
package/dist/insights.d.ts +5 -0
package/dist/insights.d.ts.map +1 -0
package/dist/insights.js +271 -0
package/dist/insights.js.map +1 -0
package/dist/joiner.d.ts +9 -0
package/dist/joiner.d.ts.map +1 -0
package/dist/joiner.js +247 -0
package/dist/joiner.js.map +1 -0
package/dist/orchestrator.d.ts +34 -0
package/dist/orchestrator.d.ts.map +1 -0
package/dist/orchestrator.js +827 -0
package/dist/orchestrator.js.map +1 -0
package/dist/pdf.d.ts +26 -0
package/dist/pdf.d.ts.map +1 -0
package/dist/pdf.js +84 -0
package/dist/pdf.js.map +1 -0
package/dist/prediction.d.ts +33 -0
package/dist/prediction.d.ts.map +1 -0
package/dist/prediction.js +316 -0
package/dist/prediction.js.map +1 -0
package/dist/prompts/loader.d.ts +38 -0
package/dist/prompts/loader.d.ts.map +1 -0
package/dist/prompts/loader.js +60 -0
package/dist/prompts/loader.js.map +1 -0
package/dist/renderer.d.ts +64 -0
package/dist/renderer.d.ts.map +1 -0
package/dist/renderer.js +923 -0
package/dist/renderer.js.map +1 -0
package/dist/runid.d.ts +57 -0
package/dist/runid.d.ts.map +1 -0
package/dist/runid.js +199 -0
package/dist/runid.js.map +1 -0
package/dist/runtime.d.ts +29 -0
package/dist/runtime.d.ts.map +1 -0
package/dist/runtime.js +366 -0
package/dist/runtime.js.map +1 -0
package/dist/scanner.d.ts +11 -0
package/dist/scanner.d.ts.map +1 -0
package/dist/scanner.js +426 -0
package/dist/scanner.js.map +1 -0
package/dist/templates.d.ts +120 -0
package/dist/templates.d.ts.map +1 -0
package/dist/templates.js +429 -0
package/dist/templates.js.map +1 -0
package/dist/tools/index.d.ts +153 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +177 -0
package/dist/tools/index.js.map +1 -0
package/dist/types.d.ts +3647 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +703 -0
package/dist/types.js.map +1 -0
package/dist/version.d.ts +7 -0
package/dist/version.d.ts.map +1 -0
package/dist/version.js +23 -0
package/dist/version.js.map +1 -0
package/docs/demo-guide.md +423 -0
package/docs/events-format.md +295 -0
package/docs/inferencemap-spec.md +344 -0
package/docs/migration-v2.md +293 -0
package/fixtures/demo/precomputed.json +142 -0
package/fixtures/demo-project/README.md +52 -0
package/fixtures/demo-project/ai-service.ts +65 -0
package/fixtures/demo-project/sample-events.jsonl +15 -0
package/fixtures/demo-project/src/ai-service.ts +128 -0
package/fixtures/demo-project/src/llm-client.ts +155 -0
package/package.json +65 -0
package/prompts/agent-analyzer.yaml +47 -0
package/prompts/ci-gate.yaml +98 -0
package/prompts/correlation-analyzer.yaml +178 -0
package/prompts/format-normalizer.yaml +46 -0
package/prompts/peak-performance.yaml +180 -0
package/prompts/pr-comment.yaml +111 -0
package/prompts/runtime-analyzer.yaml +189 -0
package/prompts/unified-analyzer.yaml +241 -0
package/schemas/inference-map.v0.1.json +215 -0
package/scripts/benchmark.ts +394 -0
package/scripts/demo-v1.5.sh +158 -0
package/scripts/sync-from-site.sh +197 -0
package/scripts/validate-sync.sh +178 -0
package/src/agent-analyzer.ts +481 -0
package/src/agent.ts +1232 -0
package/src/agents/correlation-analyzer.ts +353 -0
package/src/agents/index.ts +235 -0
package/src/agents/runtime-analyzer.ts +343 -0
package/src/analysis-types.ts +558 -0
package/src/analytics.ts +100 -0
package/src/analyzer.ts +692 -0
package/src/artifacts.ts +218 -0
package/src/benchmarks/index.ts +309 -0
package/src/cli.ts +503 -0
package/src/commands/ci.ts +336 -0
package/src/commands/config.ts +288 -0
package/src/commands/demo.ts +175 -0
package/src/commands/export.ts +297 -0
package/src/commands/history.ts +425 -0
package/src/commands/template.ts +385 -0
package/src/commands/validate-map.ts +324 -0
package/src/commands/whatif.ts +272 -0
package/src/comparison.ts +283 -0
package/src/config.ts +188 -0
package/src/connectors/helicone.ts +164 -0
package/src/connectors/index.ts +93 -0
package/src/connectors/langsmith.ts +179 -0
package/src/connectors/types.ts +180 -0
package/src/cost-estimator.ts +146 -0
package/src/costs.ts +347 -0
package/src/counterfactuals.ts +516 -0
package/src/enhancement-prompts.ts +118 -0
package/src/envelopes.ts +814 -0
package/src/format-normalizer.ts +1486 -0
package/src/history.ts +400 -0
package/src/html.ts +512 -0
package/src/impact.ts +522 -0
package/src/index.ts +83 -0
package/src/insights.ts +341 -0
package/src/joiner.ts +289 -0
package/src/orchestrator.ts +1015 -0
package/src/pdf.ts +110 -0
package/src/prediction.ts +392 -0
package/src/prompts/loader.ts +88 -0
package/src/renderer.ts +1045 -0
package/src/runid.ts +261 -0
package/src/runtime.ts +450 -0
package/src/scanner.ts +508 -0
package/src/templates.ts +561 -0
package/src/tools/index.ts +214 -0
package/src/types.ts +873 -0
package/src/version.ts +24 -0
package/templates/context-accumulation.yaml +23 -0
package/templates/cost-concentration.yaml +20 -0
package/templates/dead-code.yaml +20 -0
package/templates/latency-explainer.yaml +23 -0
package/templates/optimizations/ab-testing-framework.yaml +74 -0
package/templates/optimizations/api-gateway-optimization.yaml +81 -0
package/templates/optimizations/api-model-routing-strategy.yaml +126 -0
package/templates/optimizations/auto-scaling-optimization.yaml +85 -0
package/templates/optimizations/batch-utilization-diagnostic.yaml +142 -0
package/templates/optimizations/comprehensive-apm.yaml +76 -0
package/templates/optimizations/context-window-optimization.yaml +91 -0
package/templates/optimizations/cost-sensitive-batch-processing.yaml +77 -0
package/templates/optimizations/distributed-training-optimization.yaml +77 -0
package/templates/optimizations/document-analysis-edge.yaml +77 -0
package/templates/optimizations/document-pipeline-optimization.yaml +78 -0
package/templates/optimizations/domain-specific-distillation.yaml +78 -0
package/templates/optimizations/error-handling-optimization.yaml +76 -0
package/templates/optimizations/gptq-4bit-quantization.yaml +96 -0
package/templates/optimizations/long-context-memory-management.yaml +78 -0
package/templates/optimizations/max-tokens-optimization.yaml +76 -0
package/templates/optimizations/memory-bandwidth-optimization.yaml +73 -0
package/templates/optimizations/multi-framework-resilience.yaml +75 -0
package/templates/optimizations/multi-tenant-optimization.yaml +75 -0
package/templates/optimizations/prompt-caching-optimization.yaml +143 -0
package/templates/optimizations/pytorch-to-onnx-migration.yaml +109 -0
package/templates/optimizations/quality-monitoring.yaml +74 -0
package/templates/optimizations/realtime-budget-controls.yaml +74 -0
package/templates/optimizations/realtime-latency-optimization.yaml +74 -0
package/templates/optimizations/sglang-concurrency-optimization.yaml +78 -0
package/templates/optimizations/smart-model-routing.yaml +96 -0
package/templates/optimizations/streaming-batch-selection.yaml +167 -0
package/templates/optimizations/system-prompt-optimization.yaml +75 -0
package/templates/optimizations/tensorrt-llm-performance.yaml +77 -0
package/templates/optimizations/vllm-high-throughput-optimization.yaml +93 -0
package/templates/optimizations/vllm-migration-memory-bound.yaml +78 -0
package/templates/overpowered-extraction.yaml +32 -0
package/templates/overpowered-model.yaml +31 -0
package/templates/prompt-bloat.yaml +24 -0
package/templates/retry-explosion.yaml +28 -0
package/templates/schema/insight.schema.json +113 -0
package/templates/schema/optimization.schema.json +180 -0
package/templates/streaming-drift.yaml +30 -0
package/templates/throughput-gap.yaml +21 -0
package/templates/token-underutilization.yaml +28 -0
package/templates/untested-fallback.yaml +21 -0
package/tests/accuracy/drift-detection.test.ts +184 -0
package/tests/accuracy/false-positives.test.ts +166 -0
package/tests/accuracy/templates.test.ts +205 -0
package/tests/action/commands.test.ts +125 -0
package/tests/action/comments.test.ts +347 -0
package/tests/cli.test.ts +203 -0
package/tests/comparison.test.ts +309 -0
package/tests/correlation-analyzer.test.ts +534 -0
package/tests/counterfactuals.test.ts +347 -0
package/tests/fixtures/events/missing-id.jsonl +1 -0
package/tests/fixtures/events/missing-input.jsonl +1 -0
package/tests/fixtures/events/missing-latency.jsonl +1 -0
package/tests/fixtures/events/missing-model.jsonl +1 -0
package/tests/fixtures/events/missing-output.jsonl +1 -0
package/tests/fixtures/events/missing-provider.jsonl +1 -0
package/tests/fixtures/events/missing-ts.jsonl +1 -0
package/tests/fixtures/events/valid.csv +3 -0
package/tests/fixtures/events/valid.json +1 -0
package/tests/fixtures/events/valid.jsonl +2 -0
package/tests/fixtures/events/with-callsite.jsonl +1 -0
package/tests/fixtures/events/with-intent.jsonl +1 -0
package/tests/fixtures/events/wrong-type.jsonl +1 -0
package/tests/fixtures/repos/empty/.gitkeep +0 -0
package/tests/fixtures/repos/hybrid-router/router.py +35 -0
package/tests/fixtures/repos/saas-anthropic/agent.ts +27 -0
package/tests/fixtures/repos/saas-openai/assistant.js +33 -0
package/tests/fixtures/repos/saas-openai/client.py +26 -0
package/tests/fixtures/repos/self-hosted-vllm/inference.py +22 -0
package/tests/github-action.test.ts +292 -0
package/tests/insights.test.ts +878 -0
package/tests/joiner.test.ts +168 -0
package/tests/performance/action-latency.test.ts +132 -0
package/tests/performance/benchmark.test.ts +189 -0
package/tests/performance/cli-latency.test.ts +102 -0
package/tests/pr-comment.test.ts +313 -0
package/tests/prediction.test.ts +296 -0
package/tests/runtime-analyzer.test.ts +375 -0
package/tests/runtime.test.ts +205 -0
package/tests/scanner.test.ts +122 -0
package/tests/template-conformance.test.ts +526 -0
package/tests/unit/cost-calculator.test.ts +303 -0
package/tests/unit/credits.test.ts +180 -0
package/tests/unit/inference-map.test.ts +276 -0
package/tests/unit/schema.test.ts +300 -0
package/tsconfig.json +20 -0
package/vitest.config.ts +14 -0

package/tests/scanner.test.ts ADDED Viewed

@@ -0,0 +1,122 @@
+import { describe, it, expect, beforeAll } from 'vitest';
+import { scan } from '../src/scanner.js';
+import { join } from 'path';
+const FIXTURES_DIR = join(__dirname, 'fixtures', 'repos');
+describe('scanner', () => {
+  describe('file discovery', () => {
+    it('finds Python files', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'self-hosted-vllm'));
+      const pyFiles = result.files.filter(f => f.language === 'python');
+      expect(pyFiles.length).toBeGreaterThan(0);
+    });
+    it('finds TypeScript files', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'saas-anthropic'));
+      const tsFiles = result.files.filter(f => f.language === 'typescript');
+      expect(tsFiles.length).toBeGreaterThan(0);
+    });
+    it('finds JavaScript files', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'saas-openai'));
+      const jsFiles = result.files.filter(f => f.language === 'javascript');
+      expect(jsFiles.length).toBeGreaterThan(0);
+    });
+  });
+  describe('ignores', () => {
+    it('ignores node_modules by default', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'saas-openai'));
+      const nodeModules = result.files.filter(f => f.path.includes('node_modules'));
+      expect(nodeModules.length).toBe(0);
+    });
+    it('ignores dist by default', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'saas-openai'));
+      const dist = result.files.filter(f => f.path.includes('/dist/'));
+      expect(dist.length).toBe(0);
+    });
+    it('ignores .git by default', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'saas-openai'));
+      const git = result.files.filter(f => f.path.includes('.git/'));
+      expect(git.length).toBe(0);
+    });
+  });
+  describe('line counting', () => {
+    it('counts lines of code per file', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'self-hosted-vllm'));
+      for (const file of result.files) {
+        expect(file.loc).toBeGreaterThan(0);
+      }
+    });
+  });
+  describe('language detection', () => {
+    it('detects language from .py extension', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'self-hosted-vllm'));
+      const pyFile = result.files.find(f => f.path.endsWith('.py'));
+      expect(pyFile?.language).toBe('python');
+    });
+    it('detects language from .ts extension', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'saas-anthropic'));
+      const tsFile = result.files.find(f => f.path.endsWith('.ts'));
+      expect(tsFile?.language).toBe('typescript');
+    });
+    it('detects language from .js extension', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'saas-openai'));
+      const jsFile = result.files.find(f => f.path.endsWith('.js'));
+      expect(jsFile?.language).toBe('javascript');
+    });
+  });
+  describe('summary', () => {
+    it('returns correct totalFiles', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'hybrid-router'));
+      expect(result.summary.totalFiles).toBe(result.files.length);
+    });
+    it('returns correct totalLoc', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'hybrid-router'));
+      const sumLoc = result.files.reduce((sum, f) => sum + f.loc, 0);
+      expect(result.summary.totalLoc).toBe(sumLoc);
+    });
+    it('returns languages list', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'hybrid-router'));
+      expect(result.summary.languages).toContain('python');
+    });
+  });
+  describe('edge cases', () => {
+    it('returns empty result for empty directory', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'empty'));
+      expect(result.files.length).toBe(0);
+      expect(result.summary.totalFiles).toBe(0);
+      expect(result.summary.totalLoc).toBe(0);
+    });
+    it('throws for non-existent directory', async () => {
+      await expect(scan('/non/existent/path')).rejects.toThrow();
+    });
+  });
+  describe('result structure', () => {
+    it('includes root path', async () => {
+      const path = join(FIXTURES_DIR, 'hybrid-router');
+      const result = await scan(path);
+      expect(result.root).toBe(path);
+    });
+    it('files have relative paths', async () => {
+      const result = await scan(join(FIXTURES_DIR, 'hybrid-router'));
+      for (const file of result.files) {
+        expect(file.path.startsWith('/')).toBe(false);
+      }
+    });
+  });
+});

package/tests/template-conformance.test.ts ADDED Viewed

@@ -0,0 +1,526 @@
+/**
+ * Template Conformance Tests
+ *
+ * Validates that LLM responses from RuntimeAnalyzerAgent and CorrelationAnalyzerAgent
+ * conform to the expected output format defined in their YAML prompts.
+ *
+ * Run with API key for real LLM testing:
+ *   source .env && npx vitest run tests/template-conformance.test.ts
+ */
+import { describe, it, expect, beforeAll } from 'vitest';
+import { z } from 'zod';
+import { RuntimeAnalyzerAgent, type RuntimeAnalyzerInput } from '../src/agents/runtime-analyzer.js';
+import { CorrelationAnalyzerAgent, type CorrelationAnalyzerInput } from '../src/agents/correlation-analyzer.js';
+import { setTestPricing } from '../src/costs.js';
+import type { Callsite, InferenceEvent, RuntimeSummary } from '../src/types.js';
+// =============================================================================
+// EXPECTED SCHEMAS (from prompts/*.yaml output_format sections)
+// =============================================================================
+/**
+ * RuntimeAnalyzerAgent expected output schema
+ * From: prompts/runtime-analyzer.yaml <output_format>
+ */
+const RuntimeInsightSchema = z.object({
+  severity: z.enum(['critical', 'warning', 'info']),
+  category: z.enum(['cost', 'latency', 'reliability', 'throughput', 'waste']),
+  headline: z.string().min(1),
+  evidence: z.string().min(1),
+  recommendation: z.string().optional(),
+  impact: z.object({
+    layer: z.enum(['application', 'model', 'runtime', 'infrastructure']),
+    impactType: z.enum(['cost', 'latency', 'throughput']),
+    estimatedImpactPercent: z.number().min(0).max(100),
+    effort: z.enum(['low', 'medium', 'high']),
+  }).optional(),
+});
+const RuntimeDetectedPatternsSchema = z.object({
+  applicationType: z.enum(['rag', 'agent', 'batch', 'chat', 'pipeline', 'unknown']),
+  multiModelPipeline: z.boolean(),
+  streamingDetected: z.boolean(),
+  batchingDetected: z.boolean(),
+  cachingDetected: z.boolean(),
+});
+const RuntimeSummaryOutputSchema = z.object({
+  totalCalls: z.number(),
+  totalTokens: z.number(),
+  dominantProvider: z.string(),
+  dominantModel: z.string(),
+  estimatedDailyCostUSD: z.number(),
+});
+const RuntimeAnalyzerOutputSchema = z.object({
+  insights: z.array(RuntimeInsightSchema),
+  detectedPatterns: RuntimeDetectedPatternsSchema,
+  summary: RuntimeSummaryOutputSchema,
+});
+/**
+ * CorrelationAnalyzerAgent expected output schema
+ * From: prompts/correlation-analyzer.yaml <output_format>
+ */
+const DriftSignalSchema = z.object({
+  type: z.enum(['codeOnly', 'runtimeOnly', 'mismatch', 'patternDrift']),
+  provider: z.string().optional(),
+  model: z.string().optional(),
+  callsiteId: z.string().optional(),
+  message: z.string(),
+});
+const CorrelationSummarySchema = z.object({
+  totalCodeCallsites: z.number(),
+  totalRuntimeModels: z.number(),
+  matched: z.number(),
+  codeOnly: z.number(),
+  runtimeOnly: z.number(),
+  mismatched: z.number(),
+});
+const CorrelationInsightSchema = z.object({
+  id: z.string().optional(),
+  severity: z.enum(['critical', 'warning', 'info']),
+  category: z.enum(['cost', 'latency', 'drift', 'reliability', 'waste', 'throughput', 'security', 'best-practice']),
+  headline: z.string().min(1),
+  evidence: z.string().min(1),
+  location: z.string().optional(),
+  recommendation: z.string().optional(),
+  source: z.enum(['template', 'llm']).optional(),
+  impact: z.object({
+    layer: z.enum(['application', 'model', 'runtime', 'infrastructure']),
+    impactType: z.enum(['cost', 'latency', 'throughput']),
+    estimatedImpactPercent: z.number().min(0).max(100),
+    effort: z.enum(['low', 'medium', 'high']),
+    confidence: z.number().min(0).max(1).optional(),
+  }).optional(),
+});
+const CorrelationAnalyzerOutputSchema = z.object({
+  insights: z.array(CorrelationInsightSchema),
+  driftSignals: z.array(DriftSignalSchema),
+  correlationSummary: CorrelationSummarySchema,
+  alignmentScore: z.number().min(0).max(1),
+  overallAssessment: z.string().min(1),
+});
+// =============================================================================
+// TEST FIXTURES
+// =============================================================================
+beforeAll(() => {
+  setTestPricing({
+    'gpt-4o': { input: 5.0, output: 15.0 },
+    'gpt-4o-mini': { input: 0.15, output: 0.6 },
+    'claude-3-opus': { input: 15.0, output: 75.0 },
+    'text-embedding-3-large': { input: 0.13, output: 0.0 },
+  });
+});
+const makeEvent = (overrides: Partial<InferenceEvent> = {}): InferenceEvent => ({
+  id: `evt_${Math.random().toString(36).slice(2, 9)}`,
+  ts: '2024-01-15T10:30:00Z',
+  provider: 'openai',
+  model: 'gpt-4o',
+  input_tokens: 500,
+  output_tokens: 200,
+  latency_ms: 1200,
+  ...overrides,
+});
+const makeCallsite = (overrides: Partial<Callsite> = {}): Callsite => ({
+  id: `cs_${Math.random().toString(36).slice(2, 9)}`,
+  file: 'src/api/chat.ts',
+  line: 42,
+  provider: 'openai',
+  model: 'gpt-4o',
+  framework: null,
+  runtime: null,
+  patterns: { streaming: true },
+  confidence: 0.95,
+  ...overrides,
+});
+const makeRuntimeSummary = (): RuntimeSummary => ({
+  totalEvents: 100,
+  byProvider: {
+    openai: { calls: 80, tokens_in: 40000, tokens_out: 16000, latency_p50: 1000, latency_p95: 2500, latency_p99: 4000 },
+    anthropic: { calls: 20, tokens_in: 10000, tokens_out: 4000, latency_p50: 1200, latency_p95: 2800, latency_p99: 4500 },
+  },
+  byModel: {
+    'gpt-4o': { calls: 60, tokens_in: 30000, tokens_out: 12000, latency_p50: 1000, latency_p95: 2500, latency_p99: 4000 },
+    'gpt-4o-mini': { calls: 20, tokens_in: 10000, tokens_out: 4000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+    'claude-3-opus': { calls: 20, tokens_in: 10000, tokens_out: 4000, latency_p50: 1200, latency_p95: 2800, latency_p99: 4500 },
+  },
+  global: { p50: 1000, p95: 2500, p99: 4000 },
+});
+// =============================================================================
+// RUNTIME ANALYZER TEMPLATE CONFORMANCE TESTS
+// =============================================================================
+describe('RuntimeAnalyzerAgent Template Conformance', () => {
+  describe('output schema validation', () => {
+    it('returns output conforming to template schema', async () => {
+      const input: RuntimeAnalyzerInput = {
+        events: Array.from({ length: 20 }, (_, i) => makeEvent({
+          id: `evt_${i}`,
+          model: i < 15 ? 'gpt-4o' : 'gpt-4o-mini',
+          input_tokens: 500 + (i * 50),
+          output_tokens: 100 + (i * 10),
+          latency_ms: 800 + (i * 100),
+        })),
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // Validate against schema
+      const validation = RuntimeAnalyzerOutputSchema.safeParse(result);
+      if (!validation.success) {
+        console.error('Schema validation errors:', JSON.stringify(validation.error.issues, null, 2));
+      }
+      expect(validation.success).toBe(true);
+    });
+    it('insights have all required fields from template', async () => {
+      const input: RuntimeAnalyzerInput = {
+        events: [
+          makeEvent({ model: 'gpt-4o', input_tokens: 10000, output_tokens: 100 }), // Prompt bloat
+        ],
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      for (const insight of result.insights) {
+        // Required fields from <output_format>
+        expect(insight).toHaveProperty('severity');
+        expect(insight).toHaveProperty('category');
+        expect(insight).toHaveProperty('headline');
+        expect(insight).toHaveProperty('evidence');
+        // Enum validation
+        expect(['critical', 'warning', 'info']).toContain(insight.severity);
+        expect(['cost', 'latency', 'reliability', 'throughput', 'waste']).toContain(insight.category);
+        // Non-empty strings
+        expect(insight.headline.length).toBeGreaterThan(0);
+        expect(insight.evidence.length).toBeGreaterThan(0);
+      }
+    });
+    it('detected_patterns matches template enum values', async () => {
+      const input: RuntimeAnalyzerInput = {
+        events: [makeEvent({ streaming: true, batch_id: 'b1' })],
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // application_type enum from template
+      const validAppTypes = ['rag', 'agent', 'batch', 'chat', 'pipeline', 'unknown'];
+      expect(validAppTypes).toContain(result.detectedPatterns.applicationType);
+      // Boolean fields
+      expect(typeof result.detectedPatterns.multiModelPipeline).toBe('boolean');
+      expect(typeof result.detectedPatterns.streamingDetected).toBe('boolean');
+      expect(typeof result.detectedPatterns.batchingDetected).toBe('boolean');
+      expect(typeof result.detectedPatterns.cachingDetected).toBe('boolean');
+    });
+    it('impact estimates follow template constraints', async () => {
+      const input: RuntimeAnalyzerInput = {
+        events: Array.from({ length: 10 }, () => makeEvent()),
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      for (const insight of result.insights) {
+        if (insight.impact) {
+          // layer enum from template
+          expect(['application', 'model', 'runtime', 'infrastructure']).toContain(insight.impact.layer);
+          // impactType enum
+          expect(['cost', 'latency', 'throughput']).toContain(insight.impact.impactType);
+          // estimatedImpactPercent range (0-100)
+          expect(insight.impact.estimatedImpactPercent).toBeGreaterThanOrEqual(0);
+          expect(insight.impact.estimatedImpactPercent).toBeLessThanOrEqual(100);
+          // effort enum
+          expect(['low', 'medium', 'high']).toContain(insight.impact.effort);
+        }
+      }
+    });
+    it('respects max 10 insights constraint from template', async () => {
+      const input: RuntimeAnalyzerInput = {
+        events: Array.from({ length: 100 }, (_, i) => makeEvent({
+          id: `evt_${i}`,
+          model: ['gpt-4o', 'gpt-4o-mini', 'claude-3-opus'][i % 3],
+        })),
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // Template says "Maximum 10 insights, ranked by impact"
+      expect(result.insights.length).toBeLessThanOrEqual(10);
+    });
+  });
+  describe('semantic validation', () => {
+    it('insights reference actual data from input', async () => {
+      const input: RuntimeAnalyzerInput = {
+        events: [
+          makeEvent({ model: 'gpt-4o', latency_ms: 5000 }),
+          makeEvent({ model: 'gpt-4o', latency_ms: 5500 }),
+        ],
+        runtimeSummary: {
+          totalEvents: 2,
+          byProvider: { openai: { calls: 2, tokens_in: 1000, tokens_out: 400, latency_p50: 5250, latency_p95: 5500, latency_p99: 5500 } },
+          byModel: { 'gpt-4o': { calls: 2, tokens_in: 1000, tokens_out: 400, latency_p50: 5250, latency_p95: 5500, latency_p99: 5500 } },
+          global: { p50: 5250, p95: 5500, p99: 5500 },
+        },
+      };
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // Summary should reflect actual data
+      expect(result.summary.dominantModel).toContain('gpt');
+      expect(result.summary.totalCalls).toBeGreaterThanOrEqual(0);
+    });
+  });
+});
+// =============================================================================
+// CORRELATION ANALYZER TEMPLATE CONFORMANCE TESTS
+// =============================================================================
+describe('CorrelationAnalyzerAgent Template Conformance', () => {
+  describe('output schema validation', () => {
+    it('returns output conforming to template schema', async () => {
+      const input: CorrelationAnalyzerInput = {
+        callsites: [
+          makeCallsite({ provider: 'openai', model: 'gpt-4o' }),
+          makeCallsite({ provider: 'anthropic', model: 'claude-3-opus' }),
+        ],
+        events: [makeEvent({ provider: 'openai', model: 'gpt-4o-mini' })],
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Validate against schema
+      const validation = CorrelationAnalyzerOutputSchema.safeParse(result);
+      if (!validation.success) {
+        console.error('Schema validation errors:', JSON.stringify(validation.error.issues, null, 2));
+      }
+      expect(validation.success).toBe(true);
+    });
+    it('drift signals have correct type enum from template', async () => {
+      const input: CorrelationAnalyzerInput = {
+        callsites: [makeCallsite({ provider: 'anthropic', model: 'claude-3-opus' })],
+        events: [makeEvent({ provider: 'openai', model: 'gpt-4o' })],
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Template defines: codeOnly|runtimeOnly|modelMismatch|patternMismatch|providerMismatch
+      // Our code normalizes to: codeOnly|runtimeOnly|mismatch|patternDrift
+      const validTypes = ['codeOnly', 'runtimeOnly', 'mismatch', 'patternDrift', 'modelMismatch', 'patternMismatch', 'providerMismatch'];
+      for (const signal of result.driftSignals) {
+        expect(validTypes).toContain(signal.type);
+      }
+    });
+    it('alignment_score is between 0.0 and 1.0 as per template', async () => {
+      const input: CorrelationAnalyzerInput = {
+        callsites: [makeCallsite()],
+        events: [makeEvent()],
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(result.alignmentScore).toBeGreaterThanOrEqual(0.0);
+      expect(result.alignmentScore).toBeLessThanOrEqual(1.0);
+    });
+    it('correlation_summary has all fields from template', async () => {
+      const input: CorrelationAnalyzerInput = {
+        callsites: [makeCallsite(), makeCallsite()],
+        events: [makeEvent()],
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Required fields from template
+      expect(result.correlationSummary).toHaveProperty('totalCodeCallsites');
+      expect(result.correlationSummary).toHaveProperty('totalRuntimeModels');
+      expect(result.correlationSummary).toHaveProperty('matched');
+      expect(result.correlationSummary).toHaveProperty('codeOnly');
+      expect(result.correlationSummary).toHaveProperty('runtimeOnly');
+      expect(result.correlationSummary).toHaveProperty('mismatched');
+      // All should be numbers
+      expect(typeof result.correlationSummary.totalCodeCallsites).toBe('number');
+      expect(typeof result.correlationSummary.matched).toBe('number');
+    });
+    it('overall_assessment is non-empty string as per template', async () => {
+      const input: CorrelationAnalyzerInput = {
+        callsites: [makeCallsite()],
+        events: [makeEvent()],
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      expect(typeof result.overallAssessment).toBe('string');
+      expect(result.overallAssessment.length).toBeGreaterThan(0);
+    });
+    it('respects max 15 drift signals constraint from template', async () => {
+      const input: CorrelationAnalyzerInput = {
+        callsites: Array.from({ length: 20 }, (_, i) =>
+          makeCallsite({ id: `cs_${i}`, model: `model-${i}` })
+        ),
+        events: Array.from({ length: 20 }, (_, i) =>
+          makeEvent({ id: `evt_${i}`, model: `other-model-${i}` })
+        ),
+        runtimeSummary: makeRuntimeSummary(),
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Template says "Maximum 15 drift signals, prioritized by severity"
+      expect(result.driftSignals.length).toBeLessThanOrEqual(15);
+    });
+  });
+  describe('semantic validation', () => {
+    it('detects model mismatch correctly', async () => {
+      // Code says gpt-4o, runtime shows gpt-4o-mini
+      const input: CorrelationAnalyzerInput = {
+        callsites: [makeCallsite({ provider: 'openai', model: 'gpt-4o' })],
+        events: [makeEvent({ provider: 'openai', model: 'gpt-4o-mini' })],
+        runtimeSummary: {
+          totalEvents: 1,
+          byProvider: { openai: { calls: 1, tokens_in: 500, tokens_out: 200, latency_p50: 400, latency_p95: 400, latency_p99: 400 } },
+          byModel: { 'gpt-4o-mini': { calls: 1, tokens_in: 500, tokens_out: 200, latency_p50: 400, latency_p95: 400, latency_p99: 400 } },
+          global: { p50: 400, p95: 400, p99: 400 },
+        },
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Should detect drift (either as mismatch, codeOnly + runtimeOnly, or low alignment)
+      const hasDrift =
+        result.driftSignals.length > 0 ||
+        result.correlationSummary.mismatched > 0 ||
+        result.correlationSummary.codeOnly > 0 ||
+        result.correlationSummary.runtimeOnly > 0 ||
+        result.alignmentScore < 1.0;
+      expect(hasDrift).toBe(true);
+    });
+    it('perfect match has high alignment score', async () => {
+      // Same provider:model in code and runtime
+      const input: CorrelationAnalyzerInput = {
+        callsites: [makeCallsite({ provider: 'openai', model: 'gpt-4o' })],
+        events: [makeEvent({ provider: 'openai', model: 'gpt-4o' })],
+        runtimeSummary: {
+          totalEvents: 1,
+          byProvider: { openai: { calls: 1, tokens_in: 500, tokens_out: 200, latency_p50: 1200, latency_p95: 1200, latency_p99: 1200 } },
+          byModel: { 'gpt-4o': { calls: 1, tokens_in: 500, tokens_out: 200, latency_p50: 1200, latency_p95: 1200, latency_p99: 1200 } },
+          global: { p50: 1200, p95: 1200, p99: 1200 },
+        },
+      };
+      const { result } = await CorrelationAnalyzerAgent.execute(input);
+      // Perfect match should have high alignment
+      expect(result.alignmentScore).toBeGreaterThanOrEqual(0.5);
+    });
+  });
+});
+// =============================================================================
+// CROSS-AGENT CONSISTENCY TESTS
+// =============================================================================
+describe('Cross-Agent Template Consistency', () => {
+  it('both agents use consistent severity levels', async () => {
+    const runtimeInput: RuntimeAnalyzerInput = {
+      events: [makeEvent()],
+      runtimeSummary: makeRuntimeSummary(),
+    };
+    const correlationInput: CorrelationAnalyzerInput = {
+      callsites: [makeCallsite()],
+      events: [makeEvent()],
+      runtimeSummary: makeRuntimeSummary(),
+    };
+    const [runtimeResult, correlationResult] = await Promise.all([
+      RuntimeAnalyzerAgent.execute(runtimeInput),
+      CorrelationAnalyzerAgent.execute(correlationInput),
+    ]);
+    const validSeverities = ['critical', 'warning', 'info'];
+    for (const insight of runtimeResult.result.insights) {
+      expect(validSeverities).toContain(insight.severity);
+    }
+    for (const insight of correlationResult.result.insights) {
+      expect(validSeverities).toContain(insight.severity);
+    }
+  });
+  it('both agents use consistent impact layer enum', async () => {
+    const runtimeInput: RuntimeAnalyzerInput = {
+      events: Array.from({ length: 10 }, () => makeEvent()),
+      runtimeSummary: makeRuntimeSummary(),
+    };
+    const correlationInput: CorrelationAnalyzerInput = {
+      callsites: [makeCallsite({ model: 'claude-3-opus' })],
+      events: [makeEvent({ model: 'gpt-4o' })],
+      runtimeSummary: makeRuntimeSummary(),
+    };
+    const [runtimeResult, correlationResult] = await Promise.all([
+      RuntimeAnalyzerAgent.execute(runtimeInput),
+      CorrelationAnalyzerAgent.execute(correlationInput),
+    ]);
+    const validLayers = ['application', 'model', 'runtime', 'infrastructure'];
+    for (const insight of runtimeResult.result.insights) {
+      if (insight.impact) {
+        expect(validLayers).toContain(insight.impact.layer);
+      }
+    }
+    for (const insight of correlationResult.result.insights) {
+      if (insight.impact) {
+        expect(validLayers).toContain(insight.impact.layer);
+      }
+    }
+  });
+});