npm - @peakinfer/cli - Versions diffs - 1.0.133 - Mend

@peakinfer/cli 1.0.133

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (367) hide show

package/.claude/settings.local.json +8 -0
package/.env.example +6 -0
package/.github/workflows/peakinfer.yml +64 -0
package/CHANGELOG.md +31 -0
package/LICENSE +190 -0
package/README.md +335 -0
package/data/inferencemax.json +274 -0
package/dist/agent-analyzer.d.ts +45 -0
package/dist/agent-analyzer.d.ts.map +1 -0
package/dist/agent-analyzer.js +374 -0
package/dist/agent-analyzer.js.map +1 -0
package/dist/agent.d.ts +76 -0
package/dist/agent.d.ts.map +1 -0
package/dist/agent.js +965 -0
package/dist/agent.js.map +1 -0
package/dist/agents/correlation-analyzer.d.ts +34 -0
package/dist/agents/correlation-analyzer.d.ts.map +1 -0
package/dist/agents/correlation-analyzer.js +261 -0
package/dist/agents/correlation-analyzer.js.map +1 -0
package/dist/agents/index.d.ts +91 -0
package/dist/agents/index.d.ts.map +1 -0
package/dist/agents/index.js +111 -0
package/dist/agents/index.js.map +1 -0
package/dist/agents/runtime-analyzer.d.ts +38 -0
package/dist/agents/runtime-analyzer.d.ts.map +1 -0
package/dist/agents/runtime-analyzer.js +244 -0
package/dist/agents/runtime-analyzer.js.map +1 -0
package/dist/analysis-types.d.ts +500 -0
package/dist/analysis-types.d.ts.map +1 -0
package/dist/analysis-types.js +11 -0
package/dist/analysis-types.js.map +1 -0
package/dist/analytics.d.ts +25 -0
package/dist/analytics.d.ts.map +1 -0
package/dist/analytics.js +94 -0
package/dist/analytics.js.map +1 -0
package/dist/analyzer.d.ts +48 -0
package/dist/analyzer.d.ts.map +1 -0
package/dist/analyzer.js +547 -0
package/dist/analyzer.js.map +1 -0
package/dist/artifacts.d.ts +44 -0
package/dist/artifacts.d.ts.map +1 -0
package/dist/artifacts.js +165 -0
package/dist/artifacts.js.map +1 -0
package/dist/benchmarks/index.d.ts +88 -0
package/dist/benchmarks/index.d.ts.map +1 -0
package/dist/benchmarks/index.js +205 -0
package/dist/benchmarks/index.js.map +1 -0
package/dist/cli.d.ts +3 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +427 -0
package/dist/cli.js.map +1 -0
package/dist/commands/ci.d.ts +19 -0
package/dist/commands/ci.d.ts.map +1 -0
package/dist/commands/ci.js +253 -0
package/dist/commands/ci.js.map +1 -0
package/dist/commands/config.d.ts +16 -0
package/dist/commands/config.d.ts.map +1 -0
package/dist/commands/config.js +249 -0
package/dist/commands/config.js.map +1 -0
package/dist/commands/demo.d.ts +15 -0
package/dist/commands/demo.d.ts.map +1 -0
package/dist/commands/demo.js +106 -0
package/dist/commands/demo.js.map +1 -0
package/dist/commands/export.d.ts +14 -0
package/dist/commands/export.d.ts.map +1 -0
package/dist/commands/export.js +209 -0
package/dist/commands/export.js.map +1 -0
package/dist/commands/history.d.ts +15 -0
package/dist/commands/history.d.ts.map +1 -0
package/dist/commands/history.js +389 -0
package/dist/commands/history.js.map +1 -0
package/dist/commands/template.d.ts +14 -0
package/dist/commands/template.d.ts.map +1 -0
package/dist/commands/template.js +341 -0
package/dist/commands/template.js.map +1 -0
package/dist/commands/validate-map.d.ts +12 -0
package/dist/commands/validate-map.d.ts.map +1 -0
package/dist/commands/validate-map.js +274 -0
package/dist/commands/validate-map.js.map +1 -0
package/dist/commands/whatif.d.ts +17 -0
package/dist/commands/whatif.d.ts.map +1 -0
package/dist/commands/whatif.js +206 -0
package/dist/commands/whatif.js.map +1 -0
package/dist/comparison.d.ts +38 -0
package/dist/comparison.d.ts.map +1 -0
package/dist/comparison.js +223 -0
package/dist/comparison.js.map +1 -0
package/dist/config.d.ts +42 -0
package/dist/config.d.ts.map +1 -0
package/dist/config.js +158 -0
package/dist/config.js.map +1 -0
package/dist/connectors/helicone.d.ts +9 -0
package/dist/connectors/helicone.d.ts.map +1 -0
package/dist/connectors/helicone.js +106 -0
package/dist/connectors/helicone.js.map +1 -0
package/dist/connectors/index.d.ts +37 -0
package/dist/connectors/index.d.ts.map +1 -0
package/dist/connectors/index.js +65 -0
package/dist/connectors/index.js.map +1 -0
package/dist/connectors/langsmith.d.ts +9 -0
package/dist/connectors/langsmith.d.ts.map +1 -0
package/dist/connectors/langsmith.js +122 -0
package/dist/connectors/langsmith.js.map +1 -0
package/dist/connectors/types.d.ts +83 -0
package/dist/connectors/types.d.ts.map +1 -0
package/dist/connectors/types.js +98 -0
package/dist/connectors/types.js.map +1 -0
package/dist/cost-estimator.d.ts +46 -0
package/dist/cost-estimator.d.ts.map +1 -0
package/dist/cost-estimator.js +104 -0
package/dist/cost-estimator.js.map +1 -0
package/dist/costs.d.ts +57 -0
package/dist/costs.d.ts.map +1 -0
package/dist/costs.js +251 -0
package/dist/costs.js.map +1 -0
package/dist/counterfactuals.d.ts +29 -0
package/dist/counterfactuals.d.ts.map +1 -0
package/dist/counterfactuals.js +448 -0
package/dist/counterfactuals.js.map +1 -0
package/dist/enhancement-prompts.d.ts +41 -0
package/dist/enhancement-prompts.d.ts.map +1 -0
package/dist/enhancement-prompts.js +88 -0
package/dist/enhancement-prompts.js.map +1 -0
package/dist/envelopes.d.ts +20 -0
package/dist/envelopes.d.ts.map +1 -0
package/dist/envelopes.js +790 -0
package/dist/envelopes.js.map +1 -0
package/dist/format-normalizer.d.ts +71 -0
package/dist/format-normalizer.d.ts.map +1 -0
package/dist/format-normalizer.js +1331 -0
package/dist/format-normalizer.js.map +1 -0
package/dist/history.d.ts +79 -0
package/dist/history.d.ts.map +1 -0
package/dist/history.js +313 -0
package/dist/history.js.map +1 -0
package/dist/html.d.ts +11 -0
package/dist/html.d.ts.map +1 -0
package/dist/html.js +463 -0
package/dist/html.js.map +1 -0
package/dist/impact.d.ts +42 -0
package/dist/impact.d.ts.map +1 -0
package/dist/impact.js +443 -0
package/dist/impact.js.map +1 -0
package/dist/index.d.ts +26 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +34 -0
package/dist/index.js.map +1 -0
package/dist/insights.d.ts +5 -0
package/dist/insights.d.ts.map +1 -0
package/dist/insights.js +271 -0
package/dist/insights.js.map +1 -0
package/dist/joiner.d.ts +9 -0
package/dist/joiner.d.ts.map +1 -0
package/dist/joiner.js +247 -0
package/dist/joiner.js.map +1 -0
package/dist/orchestrator.d.ts +34 -0
package/dist/orchestrator.d.ts.map +1 -0
package/dist/orchestrator.js +827 -0
package/dist/orchestrator.js.map +1 -0
package/dist/pdf.d.ts +26 -0
package/dist/pdf.d.ts.map +1 -0
package/dist/pdf.js +84 -0
package/dist/pdf.js.map +1 -0
package/dist/prediction.d.ts +33 -0
package/dist/prediction.d.ts.map +1 -0
package/dist/prediction.js +316 -0
package/dist/prediction.js.map +1 -0
package/dist/prompts/loader.d.ts +38 -0
package/dist/prompts/loader.d.ts.map +1 -0
package/dist/prompts/loader.js +60 -0
package/dist/prompts/loader.js.map +1 -0
package/dist/renderer.d.ts +64 -0
package/dist/renderer.d.ts.map +1 -0
package/dist/renderer.js +923 -0
package/dist/renderer.js.map +1 -0
package/dist/runid.d.ts +57 -0
package/dist/runid.d.ts.map +1 -0
package/dist/runid.js +199 -0
package/dist/runid.js.map +1 -0
package/dist/runtime.d.ts +29 -0
package/dist/runtime.d.ts.map +1 -0
package/dist/runtime.js +366 -0
package/dist/runtime.js.map +1 -0
package/dist/scanner.d.ts +11 -0
package/dist/scanner.d.ts.map +1 -0
package/dist/scanner.js +426 -0
package/dist/scanner.js.map +1 -0
package/dist/templates.d.ts +120 -0
package/dist/templates.d.ts.map +1 -0
package/dist/templates.js +429 -0
package/dist/templates.js.map +1 -0
package/dist/tools/index.d.ts +153 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +177 -0
package/dist/tools/index.js.map +1 -0
package/dist/types.d.ts +3647 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +703 -0
package/dist/types.js.map +1 -0
package/dist/version.d.ts +7 -0
package/dist/version.d.ts.map +1 -0
package/dist/version.js +23 -0
package/dist/version.js.map +1 -0
package/docs/demo-guide.md +423 -0
package/docs/events-format.md +295 -0
package/docs/inferencemap-spec.md +344 -0
package/docs/migration-v2.md +293 -0
package/fixtures/demo/precomputed.json +142 -0
package/fixtures/demo-project/README.md +52 -0
package/fixtures/demo-project/ai-service.ts +65 -0
package/fixtures/demo-project/sample-events.jsonl +15 -0
package/fixtures/demo-project/src/ai-service.ts +128 -0
package/fixtures/demo-project/src/llm-client.ts +155 -0
package/package.json +65 -0
package/prompts/agent-analyzer.yaml +47 -0
package/prompts/ci-gate.yaml +98 -0
package/prompts/correlation-analyzer.yaml +178 -0
package/prompts/format-normalizer.yaml +46 -0
package/prompts/peak-performance.yaml +180 -0
package/prompts/pr-comment.yaml +111 -0
package/prompts/runtime-analyzer.yaml +189 -0
package/prompts/unified-analyzer.yaml +241 -0
package/schemas/inference-map.v0.1.json +215 -0
package/scripts/benchmark.ts +394 -0
package/scripts/demo-v1.5.sh +158 -0
package/scripts/sync-from-site.sh +197 -0
package/scripts/validate-sync.sh +178 -0
package/src/agent-analyzer.ts +481 -0
package/src/agent.ts +1232 -0
package/src/agents/correlation-analyzer.ts +353 -0
package/src/agents/index.ts +235 -0
package/src/agents/runtime-analyzer.ts +343 -0
package/src/analysis-types.ts +558 -0
package/src/analytics.ts +100 -0
package/src/analyzer.ts +692 -0
package/src/artifacts.ts +218 -0
package/src/benchmarks/index.ts +309 -0
package/src/cli.ts +503 -0
package/src/commands/ci.ts +336 -0
package/src/commands/config.ts +288 -0
package/src/commands/demo.ts +175 -0
package/src/commands/export.ts +297 -0
package/src/commands/history.ts +425 -0
package/src/commands/template.ts +385 -0
package/src/commands/validate-map.ts +324 -0
package/src/commands/whatif.ts +272 -0
package/src/comparison.ts +283 -0
package/src/config.ts +188 -0
package/src/connectors/helicone.ts +164 -0
package/src/connectors/index.ts +93 -0
package/src/connectors/langsmith.ts +179 -0
package/src/connectors/types.ts +180 -0
package/src/cost-estimator.ts +146 -0
package/src/costs.ts +347 -0
package/src/counterfactuals.ts +516 -0
package/src/enhancement-prompts.ts +118 -0
package/src/envelopes.ts +814 -0
package/src/format-normalizer.ts +1486 -0
package/src/history.ts +400 -0
package/src/html.ts +512 -0
package/src/impact.ts +522 -0
package/src/index.ts +83 -0
package/src/insights.ts +341 -0
package/src/joiner.ts +289 -0
package/src/orchestrator.ts +1015 -0
package/src/pdf.ts +110 -0
package/src/prediction.ts +392 -0
package/src/prompts/loader.ts +88 -0
package/src/renderer.ts +1045 -0
package/src/runid.ts +261 -0
package/src/runtime.ts +450 -0
package/src/scanner.ts +508 -0
package/src/templates.ts +561 -0
package/src/tools/index.ts +214 -0
package/src/types.ts +873 -0
package/src/version.ts +24 -0
package/templates/context-accumulation.yaml +23 -0
package/templates/cost-concentration.yaml +20 -0
package/templates/dead-code.yaml +20 -0
package/templates/latency-explainer.yaml +23 -0
package/templates/optimizations/ab-testing-framework.yaml +74 -0
package/templates/optimizations/api-gateway-optimization.yaml +81 -0
package/templates/optimizations/api-model-routing-strategy.yaml +126 -0
package/templates/optimizations/auto-scaling-optimization.yaml +85 -0
package/templates/optimizations/batch-utilization-diagnostic.yaml +142 -0
package/templates/optimizations/comprehensive-apm.yaml +76 -0
package/templates/optimizations/context-window-optimization.yaml +91 -0
package/templates/optimizations/cost-sensitive-batch-processing.yaml +77 -0
package/templates/optimizations/distributed-training-optimization.yaml +77 -0
package/templates/optimizations/document-analysis-edge.yaml +77 -0
package/templates/optimizations/document-pipeline-optimization.yaml +78 -0
package/templates/optimizations/domain-specific-distillation.yaml +78 -0
package/templates/optimizations/error-handling-optimization.yaml +76 -0
package/templates/optimizations/gptq-4bit-quantization.yaml +96 -0
package/templates/optimizations/long-context-memory-management.yaml +78 -0
package/templates/optimizations/max-tokens-optimization.yaml +76 -0
package/templates/optimizations/memory-bandwidth-optimization.yaml +73 -0
package/templates/optimizations/multi-framework-resilience.yaml +75 -0
package/templates/optimizations/multi-tenant-optimization.yaml +75 -0
package/templates/optimizations/prompt-caching-optimization.yaml +143 -0
package/templates/optimizations/pytorch-to-onnx-migration.yaml +109 -0
package/templates/optimizations/quality-monitoring.yaml +74 -0
package/templates/optimizations/realtime-budget-controls.yaml +74 -0
package/templates/optimizations/realtime-latency-optimization.yaml +74 -0
package/templates/optimizations/sglang-concurrency-optimization.yaml +78 -0
package/templates/optimizations/smart-model-routing.yaml +96 -0
package/templates/optimizations/streaming-batch-selection.yaml +167 -0
package/templates/optimizations/system-prompt-optimization.yaml +75 -0
package/templates/optimizations/tensorrt-llm-performance.yaml +77 -0
package/templates/optimizations/vllm-high-throughput-optimization.yaml +93 -0
package/templates/optimizations/vllm-migration-memory-bound.yaml +78 -0
package/templates/overpowered-extraction.yaml +32 -0
package/templates/overpowered-model.yaml +31 -0
package/templates/prompt-bloat.yaml +24 -0
package/templates/retry-explosion.yaml +28 -0
package/templates/schema/insight.schema.json +113 -0
package/templates/schema/optimization.schema.json +180 -0
package/templates/streaming-drift.yaml +30 -0
package/templates/throughput-gap.yaml +21 -0
package/templates/token-underutilization.yaml +28 -0
package/templates/untested-fallback.yaml +21 -0
package/tests/accuracy/drift-detection.test.ts +184 -0
package/tests/accuracy/false-positives.test.ts +166 -0
package/tests/accuracy/templates.test.ts +205 -0
package/tests/action/commands.test.ts +125 -0
package/tests/action/comments.test.ts +347 -0
package/tests/cli.test.ts +203 -0
package/tests/comparison.test.ts +309 -0
package/tests/correlation-analyzer.test.ts +534 -0
package/tests/counterfactuals.test.ts +347 -0
package/tests/fixtures/events/missing-id.jsonl +1 -0
package/tests/fixtures/events/missing-input.jsonl +1 -0
package/tests/fixtures/events/missing-latency.jsonl +1 -0
package/tests/fixtures/events/missing-model.jsonl +1 -0
package/tests/fixtures/events/missing-output.jsonl +1 -0
package/tests/fixtures/events/missing-provider.jsonl +1 -0
package/tests/fixtures/events/missing-ts.jsonl +1 -0
package/tests/fixtures/events/valid.csv +3 -0
package/tests/fixtures/events/valid.json +1 -0
package/tests/fixtures/events/valid.jsonl +2 -0
package/tests/fixtures/events/with-callsite.jsonl +1 -0
package/tests/fixtures/events/with-intent.jsonl +1 -0
package/tests/fixtures/events/wrong-type.jsonl +1 -0
package/tests/fixtures/repos/empty/.gitkeep +0 -0
package/tests/fixtures/repos/hybrid-router/router.py +35 -0
package/tests/fixtures/repos/saas-anthropic/agent.ts +27 -0
package/tests/fixtures/repos/saas-openai/assistant.js +33 -0
package/tests/fixtures/repos/saas-openai/client.py +26 -0
package/tests/fixtures/repos/self-hosted-vllm/inference.py +22 -0
package/tests/github-action.test.ts +292 -0
package/tests/insights.test.ts +878 -0
package/tests/joiner.test.ts +168 -0
package/tests/performance/action-latency.test.ts +132 -0
package/tests/performance/benchmark.test.ts +189 -0
package/tests/performance/cli-latency.test.ts +102 -0
package/tests/pr-comment.test.ts +313 -0
package/tests/prediction.test.ts +296 -0
package/tests/runtime-analyzer.test.ts +375 -0
package/tests/runtime.test.ts +205 -0
package/tests/scanner.test.ts +122 -0
package/tests/template-conformance.test.ts +526 -0
package/tests/unit/cost-calculator.test.ts +303 -0
package/tests/unit/credits.test.ts +180 -0
package/tests/unit/inference-map.test.ts +276 -0
package/tests/unit/schema.test.ts +300 -0
package/tsconfig.json +20 -0
package/vitest.config.ts +14 -0

package/tests/runtime-analyzer.test.ts ADDED Viewed

@@ -0,0 +1,375 @@
+import { describe, it, expect, beforeAll } from 'vitest';
+import { RuntimeAnalyzerAgent, type RuntimeAnalyzerInput } from '../src/agents/runtime-analyzer.js';
+import { setTestPricing } from '../src/costs.js';
+import type { InferenceEvent, RuntimeSummary } from '../src/types.js';
+// =============================================================================
+// TEST FIXTURES
+// =============================================================================
+beforeAll(() => {
+  setTestPricing({
+    'gpt-4o': { input: 5.0, output: 15.0 },
+    'gpt-4o-mini': { input: 0.15, output: 0.6 },
+    'claude-3-opus': { input: 15.0, output: 75.0 },
+    'claude-3-5-sonnet': { input: 3.0, output: 15.0 },
+  });
+});
+const makeEvent = (overrides: Partial<InferenceEvent> = {}): InferenceEvent => ({
+  id: `evt_${Math.random().toString(36).slice(2, 9)}`,
+  ts: '2024-01-01T00:00:00Z',
+  provider: 'openai',
+  model: 'gpt-4o',
+  input_tokens: 100,
+  output_tokens: 50,
+  latency_ms: 420,
+  ...overrides,
+});
+const makeRuntimeSummary = (overrides: Partial<RuntimeSummary> = {}): RuntimeSummary => ({
+  totalEvents: 100,
+  byProvider: {
+    openai: {
+      calls: 80,
+      tokens_in: 8000,
+      tokens_out: 4000,
+      latency_p50: 400,
+      latency_p95: 800,
+      latency_p99: 1200,
+    },
+    anthropic: {
+      calls: 20,
+      tokens_in: 2000,
+      tokens_out: 1000,
+      latency_p50: 500,
+      latency_p95: 1000,
+      latency_p99: 1500,
+    },
+  },
+  byModel: {
+    'gpt-4o': {
+      calls: 60,
+      tokens_in: 6000,
+      tokens_out: 3000,
+      latency_p50: 350,
+      latency_p95: 700,
+      latency_p99: 1100,
+    },
+    'gpt-4o-mini': {
+      calls: 20,
+      tokens_in: 2000,
+      tokens_out: 1000,
+      latency_p50: 200,
+      latency_p95: 400,
+      latency_p99: 600,
+    },
+    'claude-3-5-sonnet': {
+      calls: 20,
+      tokens_in: 2000,
+      tokens_out: 1000,
+      latency_p50: 500,
+      latency_p95: 1000,
+      latency_p99: 1500,
+    },
+  },
+  global: {
+    p50: 400,
+    p95: 800,
+    p99: 1200,
+  },
+  ...overrides,
+});
+const makeInput = (overrides: Partial<RuntimeAnalyzerInput> = {}): RuntimeAnalyzerInput => ({
+  events: Array.from({ length: 10 }, (_, i) => makeEvent({ id: `evt_${i}` })),
+  runtimeSummary: makeRuntimeSummary(),
+  ...overrides,
+});
+// =============================================================================
+// AGENT PROPERTIES TESTS
+// =============================================================================
+describe('RuntimeAnalyzerAgent', () => {
+  describe('agent properties', () => {
+    it('has correct name', () => {
+      expect(RuntimeAnalyzerAgent.name).toBe('runtime-analyzer');
+    });
+    it('has description', () => {
+      expect(RuntimeAnalyzerAgent.description).toBeDefined();
+      expect(RuntimeAnalyzerAgent.description.length).toBeGreaterThan(0);
+    });
+    it('has tools registry', () => {
+      expect(RuntimeAnalyzerAgent.tools).toBeDefined();
+    });
+  });
+  // =============================================================================
+  // EXECUTION TESTS
+  // =============================================================================
+  describe('execute', () => {
+    it('returns valid output structure', async () => {
+      const input = makeInput();
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // Check insights array
+      expect(Array.isArray(result.insights)).toBe(true);
+      // Check detectedPatterns structure
+      expect(result.detectedPatterns).toHaveProperty('applicationType');
+      expect(result.detectedPatterns).toHaveProperty('multiModelPipeline');
+      expect(result.detectedPatterns).toHaveProperty('streamingDetected');
+      expect(result.detectedPatterns).toHaveProperty('batchingDetected');
+      expect(result.detectedPatterns).toHaveProperty('cachingDetected');
+      // Check summary structure
+      expect(result.summary).toHaveProperty('totalCalls');
+      expect(result.summary).toHaveProperty('totalTokens');
+      expect(result.summary).toHaveProperty('dominantProvider');
+      expect(result.summary).toHaveProperty('dominantModel');
+      expect(result.summary).toHaveProperty('estimatedDailyCostUSD');
+    });
+    it('application type is valid enum value', async () => {
+      const input = makeInput();
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      const validTypes = ['rag', 'agent', 'batch', 'chat', 'pipeline', 'unknown'];
+      expect(validTypes).toContain(result.detectedPatterns.applicationType);
+    });
+    it('correctly detects multi-model pipeline', async () => {
+      const input = makeInput({
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+            'gpt-4o-mini': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 200, latency_p95: 400, latency_p99: 600 },
+          },
+        }),
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.detectedPatterns.multiModelPipeline).toBe(true);
+    });
+    it('detects streaming pattern from events', async () => {
+      const input = makeInput({
+        events: [
+          makeEvent({ streaming: true }),
+          makeEvent({ streaming: true }),
+          makeEvent({ streaming: false }),
+        ],
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.detectedPatterns.streamingDetected).toBe(true);
+    });
+    it('detects batching pattern from events', async () => {
+      const input = makeInput({
+        events: [
+          makeEvent({ batch_id: 'batch_001' }),
+          makeEvent({ batch_id: 'batch_001' }),
+          makeEvent(),
+        ],
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.detectedPatterns.batchingDetected).toBe(true);
+    });
+    it('detects caching pattern from events', async () => {
+      const input = makeInput({
+        events: [
+          makeEvent({ cached: true }),
+          makeEvent({ cached: false }),
+        ],
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.detectedPatterns.cachingDetected).toBe(true);
+    });
+    it('calculates total tokens', async () => {
+      const runtimeSummary = makeRuntimeSummary({
+        byModel: {
+          'gpt-4o': { calls: 10, tokens_in: 1000, tokens_out: 500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+        },
+      });
+      const input = makeInput({ runtimeSummary });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // Total tokens should be a reasonable positive number
+      // LLM may calculate from events or summary differently
+      expect(result.summary.totalTokens).toBeGreaterThan(0);
+    });
+    it('identifies dominant provider', async () => {
+      const runtimeSummary = makeRuntimeSummary({
+        byProvider: {
+          openai: { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          anthropic: { calls: 20, tokens_in: 2000, tokens_out: 1000, latency_p50: 500, latency_p95: 1000, latency_p99: 1500 },
+        },
+      });
+      const input = makeInput({ runtimeSummary });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.summary.dominantProvider).toBe('openai');
+    });
+    it('identifies dominant model', async () => {
+      const runtimeSummary = makeRuntimeSummary({
+        byModel: {
+          'gpt-4o': { calls: 80, tokens_in: 8000, tokens_out: 4000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          'gpt-4o-mini': { calls: 20, tokens_in: 2000, tokens_out: 1000, latency_p50: 200, latency_p95: 400, latency_p99: 600 },
+        },
+      });
+      const input = makeInput({ runtimeSummary });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.summary.dominantModel).toBe('gpt-4o');
+    });
+  });
+  // =============================================================================
+  // EDGE CASES
+  // =============================================================================
+  describe('edge cases', () => {
+    it('handles empty events array', async () => {
+      const input = makeInput({
+        events: [],
+        runtimeSummary: makeRuntimeSummary({ totalEvents: 0 }),
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.detectedPatterns.streamingDetected).toBe(false);
+      expect(result.detectedPatterns.batchingDetected).toBe(false);
+      expect(result.detectedPatterns.cachingDetected).toBe(false);
+    });
+    it('handles single model', async () => {
+      const input = makeInput({
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // LLM may still detect patterns; key assertion: returns valid result
+      expect(result.detectedPatterns).toBeDefined();
+      expect(result.summary.dominantModel).toBeDefined();
+    });
+    it('handles missing optional event fields', async () => {
+      const input = makeInput({
+        events: [makeEvent()], // No streaming, batch_id, cached, retry_count, fallback_used
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.detectedPatterns.streamingDetected).toBe(false);
+      expect(result.detectedPatterns.batchingDetected).toBe(false);
+      expect(result.detectedPatterns.cachingDetected).toBe(false);
+    });
+    it('handles empty byProvider and byModel', async () => {
+      const input = makeInput({
+        runtimeSummary: {
+          totalEvents: 0,
+          byProvider: {},
+          byModel: {},
+          global: { p50: 0, p95: 0, p99: 0 },
+        },
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // LLM may return 'unknown', 'none', 'n/a' etc for empty data
+      expect(['unknown', 'none', 'n/a', '']).toContain(result.summary.dominantProvider.toLowerCase());
+      expect(['unknown', 'none', 'n/a', '']).toContain(result.summary.dominantModel.toLowerCase());
+    });
+  });
+  // =============================================================================
+  // PATTERN DETECTION COMBINATIONS
+  // =============================================================================
+  describe('pattern detection combinations', () => {
+    it('detects all patterns when present', async () => {
+      const input = makeInput({
+        events: [
+          makeEvent({ streaming: true, batch_id: 'b1', cached: true }),
+        ],
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+            'claude-3-5-sonnet': { calls: 50, tokens_in: 5000, tokens_out: 2500, latency_p50: 500, latency_p95: 1000, latency_p99: 1500 },
+          },
+        }),
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      expect(result.detectedPatterns.streamingDetected).toBe(true);
+      expect(result.detectedPatterns.batchingDetected).toBe(true);
+      expect(result.detectedPatterns.cachingDetected).toBe(true);
+      expect(result.detectedPatterns.multiModelPipeline).toBe(true);
+    });
+    it('returns valid patterns structure for minimal input', async () => {
+      const input = makeInput({
+        events: [makeEvent()], // No optional fields
+        runtimeSummary: makeRuntimeSummary({
+          byModel: {
+            'gpt-4o': { calls: 100, tokens_in: 10000, tokens_out: 5000, latency_p50: 400, latency_p95: 800, latency_p99: 1200 },
+          },
+        }),
+      });
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // LLM may infer patterns from context; key assertion: returns valid structure
+      expect(typeof result.detectedPatterns.streamingDetected).toBe('boolean');
+      expect(typeof result.detectedPatterns.batchingDetected).toBe('boolean');
+      expect(typeof result.detectedPatterns.cachingDetected).toBe('boolean');
+      expect(typeof result.detectedPatterns.multiModelPipeline).toBe('boolean');
+    });
+  });
+  // =============================================================================
+  // INSIGHTS VALIDATION (when LLM is available)
+  // =============================================================================
+  describe('insights structure', () => {
+    it('insights have required fields when generated', async () => {
+      const input = makeInput();
+      const { result } = await RuntimeAnalyzerAgent.execute(input);
+      // Insights may be empty in fallback mode, but if present, must have structure
+      for (const insight of result.insights) {
+        expect(insight).toHaveProperty('id');
+        expect(insight).toHaveProperty('severity');
+        expect(insight).toHaveProperty('category');
+        expect(insight).toHaveProperty('headline');
+        expect(insight).toHaveProperty('evidence');
+        expect(['critical', 'warning', 'info']).toContain(insight.severity);
+      }
+    });
+  });
+});

package/tests/runtime.test.ts ADDED Viewed

@@ -0,0 +1,205 @@
+import { describe, it, expect, beforeEach } from 'vitest';
+import { parseEvents, aggregate, percentile } from '../src/runtime.js';
+import { writeFileSync, mkdirSync, rmSync } from 'fs';
+import { join } from 'path';
+const FIXTURES_DIR = join(__dirname, 'fixtures', 'events');
+// Ensure fixtures directory exists
+beforeEach(() => {
+  mkdirSync(FIXTURES_DIR, { recursive: true });
+});
+describe('runtime parser', () => {
+  describe('JSONL parsing', () => {
+    it('parses valid JSONL', async () => {
+      const content = [
+        '{"id":"1","ts":"2024-01-01T00:00:00Z","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}',
+        '{"id":"2","ts":"2024-01-01T00:01:00Z","provider":"openai","model":"gpt-4o","input_tokens":200,"output_tokens":80,"latency_ms":580}',
+      ].join('\n');
+      const path = join(FIXTURES_DIR, 'valid.jsonl');
+      writeFileSync(path, content);
+      const events = await parseEvents(path);
+      expect(events.length).toBe(2);
+      expect(events[0].provider).toBe('openai');
+      expect(events[1].latency_ms).toBe(580);
+    });
+  });
+  describe('JSON array parsing', () => {
+    it('parses valid JSON array', async () => {
+      const data = [
+        { id: '1', ts: '2024-01-01T00:00:00Z', provider: 'anthropic', model: 'claude-3-sonnet-20240229', input_tokens: 150, output_tokens: 60, latency_ms: 350 },
+        { id: '2', ts: '2024-01-01T00:01:00Z', provider: 'anthropic', model: 'claude-3-sonnet-20240229', input_tokens: 180, output_tokens: 90, latency_ms: 400 },
+      ];
+      const path = join(FIXTURES_DIR, 'valid.json');
+      writeFileSync(path, JSON.stringify(data));
+      const events = await parseEvents(path);
+      expect(events.length).toBe(2);
+      expect(events[0].provider).toBe('anthropic');
+    });
+  });
+  describe('CSV parsing', () => {
+    it('parses valid CSV', async () => {
+      const content = [
+        'id,ts,provider,model,input_tokens,output_tokens,latency_ms',
+        '1,2024-01-01T00:00:00Z,openai,gpt-4o,100,50,420',
+        '2,2024-01-01T00:01:00Z,openai,gpt-4o,200,80,580',
+      ].join('\n');
+      const path = join(FIXTURES_DIR, 'valid.csv');
+      writeFileSync(path, content);
+      const events = await parseEvents(path);
+      expect(events.length).toBe(2);
+      expect(events[0].input_tokens).toBe(100);
+    });
+  });
+  describe('validation', () => {
+    it('rejects missing id field', async () => {
+      const content = '{"ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}';
+      const path = join(FIXTURES_DIR, 'missing-id.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('rejects missing ts field', async () => {
+      const content = '{"id":"1","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}';
+      const path = join(FIXTURES_DIR, 'missing-ts.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('rejects missing provider field', async () => {
+      const content = '{"id":"1","ts":"2024-01-01","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420}';
+      const path = join(FIXTURES_DIR, 'missing-provider.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('rejects missing model field', async () => {
+      const content = '{"id":"1","ts":"2024-01-01","provider":"openai","input_tokens":100,"output_tokens":50,"latency_ms":420}';
+      const path = join(FIXTURES_DIR, 'missing-model.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('rejects missing input_tokens field', async () => {
+      const content = '{"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","output_tokens":50,"latency_ms":420}';
+      const path = join(FIXTURES_DIR, 'missing-input.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('rejects missing output_tokens field', async () => {
+      const content = '{"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"latency_ms":420}';
+      const path = join(FIXTURES_DIR, 'missing-output.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('rejects missing latency_ms field', async () => {
+      const content = '{"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50}';
+      const path = join(FIXTURES_DIR, 'missing-latency.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('rejects wrong type for latency_ms', async () => {
+      const content = '{"id":"1","ts":"2024-01-01","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":"fast"}';
+      const path = join(FIXTURES_DIR, 'wrong-type.jsonl');
+      writeFileSync(path, content);
+      await expect(parseEvents(path)).rejects.toThrow();
+    });
+    it('accepts optional intent field', async () => {
+      const content = '{"id":"1","ts":"2024-01-01T00:00:00Z","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420,"intent":"chat"}';
+      const path = join(FIXTURES_DIR, 'with-intent.jsonl');
+      writeFileSync(path, content);
+      const events = await parseEvents(path);
+      expect(events[0].intent).toBe('chat');
+    });
+    it('accepts optional callsite_id field', async () => {
+      const content = '{"id":"1","ts":"2024-01-01T00:00:00Z","provider":"openai","model":"gpt-4o","input_tokens":100,"output_tokens":50,"latency_ms":420,"callsite_id":"cs_001"}';
+      const path = join(FIXTURES_DIR, 'with-callsite.jsonl');
+      writeFileSync(path, content);
+      const events = await parseEvents(path);
+      expect(events[0].callsite_id).toBe('cs_001');
+    });
+  });
+  describe('percentile calculation', () => {
+    it('calculates p50 correctly', () => {
+      const values = [100, 200, 300, 400, 500];
+      expect(percentile(values, 50)).toBe(300);
+    });
+    it('calculates p95 correctly', () => {
+      const values = Array.from({ length: 100 }, (_, i) => (i + 1) * 10);
+      expect(percentile(values, 95)).toBe(950);
+    });
+    it('calculates p99 correctly', () => {
+      const values = Array.from({ length: 100 }, (_, i) => (i + 1) * 10);
+      expect(percentile(values, 99)).toBe(990);
+    });
+  });
+  describe('aggregation', () => {
+    it('aggregates by provider', () => {
+      const events = [
+        { id: '1', ts: '2024-01-01', provider: 'openai' as const, model: 'gpt-4o', input_tokens: 100, output_tokens: 50, latency_ms: 420 },
+        { id: '2', ts: '2024-01-01', provider: 'openai' as const, model: 'gpt-4o', input_tokens: 200, output_tokens: 80, latency_ms: 580 },
+        { id: '3', ts: '2024-01-01', provider: 'anthropic' as const, model: 'claude-3', input_tokens: 150, output_tokens: 60, latency_ms: 350 },
+      ];
+      const summary = aggregate(events);
+      expect(summary.byProvider['openai'].calls).toBe(2);
+      expect(summary.byProvider['anthropic'].calls).toBe(1);
+    });
+    it('aggregates by model', () => {
+      const events = [
+        { id: '1', ts: '2024-01-01', provider: 'openai' as const, model: 'gpt-4o', input_tokens: 100, output_tokens: 50, latency_ms: 420 },
+        { id: '2', ts: '2024-01-01', provider: 'openai' as const, model: 'gpt-4o-mini', input_tokens: 200, output_tokens: 80, latency_ms: 180 },
+      ];
+      const summary = aggregate(events);
+      expect(summary.byModel['gpt-4o'].calls).toBe(1);
+      expect(summary.byModel['gpt-4o-mini'].calls).toBe(1);
+    });
+    it('handles single event', () => {
+      const events = [
+        { id: '1', ts: '2024-01-01', provider: 'openai' as const, model: 'gpt-4o', input_tokens: 100, output_tokens: 50, latency_ms: 420 },
+      ];
+      const summary = aggregate(events);
+      expect(summary.totalEvents).toBe(1);
+      expect(summary.global.p50).toBe(420);
+    });
+    it('handles empty array', () => {
+      const summary = aggregate([]);
+      expect(summary.totalEvents).toBe(0);
+      expect(summary.global.p50).toBe(0);
+    });
+  });
+});