npm - @peakinfer/cli - Versions diffs - 1.0.133 - Mend

@peakinfer/cli 1.0.133

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (367) hide show

package/.claude/settings.local.json +8 -0
package/.env.example +6 -0
package/.github/workflows/peakinfer.yml +64 -0
package/CHANGELOG.md +31 -0
package/LICENSE +190 -0
package/README.md +335 -0
package/data/inferencemax.json +274 -0
package/dist/agent-analyzer.d.ts +45 -0
package/dist/agent-analyzer.d.ts.map +1 -0
package/dist/agent-analyzer.js +374 -0
package/dist/agent-analyzer.js.map +1 -0
package/dist/agent.d.ts +76 -0
package/dist/agent.d.ts.map +1 -0
package/dist/agent.js +965 -0
package/dist/agent.js.map +1 -0
package/dist/agents/correlation-analyzer.d.ts +34 -0
package/dist/agents/correlation-analyzer.d.ts.map +1 -0
package/dist/agents/correlation-analyzer.js +261 -0
package/dist/agents/correlation-analyzer.js.map +1 -0
package/dist/agents/index.d.ts +91 -0
package/dist/agents/index.d.ts.map +1 -0
package/dist/agents/index.js +111 -0
package/dist/agents/index.js.map +1 -0
package/dist/agents/runtime-analyzer.d.ts +38 -0
package/dist/agents/runtime-analyzer.d.ts.map +1 -0
package/dist/agents/runtime-analyzer.js +244 -0
package/dist/agents/runtime-analyzer.js.map +1 -0
package/dist/analysis-types.d.ts +500 -0
package/dist/analysis-types.d.ts.map +1 -0
package/dist/analysis-types.js +11 -0
package/dist/analysis-types.js.map +1 -0
package/dist/analytics.d.ts +25 -0
package/dist/analytics.d.ts.map +1 -0
package/dist/analytics.js +94 -0
package/dist/analytics.js.map +1 -0
package/dist/analyzer.d.ts +48 -0
package/dist/analyzer.d.ts.map +1 -0
package/dist/analyzer.js +547 -0
package/dist/analyzer.js.map +1 -0
package/dist/artifacts.d.ts +44 -0
package/dist/artifacts.d.ts.map +1 -0
package/dist/artifacts.js +165 -0
package/dist/artifacts.js.map +1 -0
package/dist/benchmarks/index.d.ts +88 -0
package/dist/benchmarks/index.d.ts.map +1 -0
package/dist/benchmarks/index.js +205 -0
package/dist/benchmarks/index.js.map +1 -0
package/dist/cli.d.ts +3 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +427 -0
package/dist/cli.js.map +1 -0
package/dist/commands/ci.d.ts +19 -0
package/dist/commands/ci.d.ts.map +1 -0
package/dist/commands/ci.js +253 -0
package/dist/commands/ci.js.map +1 -0
package/dist/commands/config.d.ts +16 -0
package/dist/commands/config.d.ts.map +1 -0
package/dist/commands/config.js +249 -0
package/dist/commands/config.js.map +1 -0
package/dist/commands/demo.d.ts +15 -0
package/dist/commands/demo.d.ts.map +1 -0
package/dist/commands/demo.js +106 -0
package/dist/commands/demo.js.map +1 -0
package/dist/commands/export.d.ts +14 -0
package/dist/commands/export.d.ts.map +1 -0
package/dist/commands/export.js +209 -0
package/dist/commands/export.js.map +1 -0
package/dist/commands/history.d.ts +15 -0
package/dist/commands/history.d.ts.map +1 -0
package/dist/commands/history.js +389 -0
package/dist/commands/history.js.map +1 -0
package/dist/commands/template.d.ts +14 -0
package/dist/commands/template.d.ts.map +1 -0
package/dist/commands/template.js +341 -0
package/dist/commands/template.js.map +1 -0
package/dist/commands/validate-map.d.ts +12 -0
package/dist/commands/validate-map.d.ts.map +1 -0
package/dist/commands/validate-map.js +274 -0
package/dist/commands/validate-map.js.map +1 -0
package/dist/commands/whatif.d.ts +17 -0
package/dist/commands/whatif.d.ts.map +1 -0
package/dist/commands/whatif.js +206 -0
package/dist/commands/whatif.js.map +1 -0
package/dist/comparison.d.ts +38 -0
package/dist/comparison.d.ts.map +1 -0
package/dist/comparison.js +223 -0
package/dist/comparison.js.map +1 -0
package/dist/config.d.ts +42 -0
package/dist/config.d.ts.map +1 -0
package/dist/config.js +158 -0
package/dist/config.js.map +1 -0
package/dist/connectors/helicone.d.ts +9 -0
package/dist/connectors/helicone.d.ts.map +1 -0
package/dist/connectors/helicone.js +106 -0
package/dist/connectors/helicone.js.map +1 -0
package/dist/connectors/index.d.ts +37 -0
package/dist/connectors/index.d.ts.map +1 -0
package/dist/connectors/index.js +65 -0
package/dist/connectors/index.js.map +1 -0
package/dist/connectors/langsmith.d.ts +9 -0
package/dist/connectors/langsmith.d.ts.map +1 -0
package/dist/connectors/langsmith.js +122 -0
package/dist/connectors/langsmith.js.map +1 -0
package/dist/connectors/types.d.ts +83 -0
package/dist/connectors/types.d.ts.map +1 -0
package/dist/connectors/types.js +98 -0
package/dist/connectors/types.js.map +1 -0
package/dist/cost-estimator.d.ts +46 -0
package/dist/cost-estimator.d.ts.map +1 -0
package/dist/cost-estimator.js +104 -0
package/dist/cost-estimator.js.map +1 -0
package/dist/costs.d.ts +57 -0
package/dist/costs.d.ts.map +1 -0
package/dist/costs.js +251 -0
package/dist/costs.js.map +1 -0
package/dist/counterfactuals.d.ts +29 -0
package/dist/counterfactuals.d.ts.map +1 -0
package/dist/counterfactuals.js +448 -0
package/dist/counterfactuals.js.map +1 -0
package/dist/enhancement-prompts.d.ts +41 -0
package/dist/enhancement-prompts.d.ts.map +1 -0
package/dist/enhancement-prompts.js +88 -0
package/dist/enhancement-prompts.js.map +1 -0
package/dist/envelopes.d.ts +20 -0
package/dist/envelopes.d.ts.map +1 -0
package/dist/envelopes.js +790 -0
package/dist/envelopes.js.map +1 -0
package/dist/format-normalizer.d.ts +71 -0
package/dist/format-normalizer.d.ts.map +1 -0
package/dist/format-normalizer.js +1331 -0
package/dist/format-normalizer.js.map +1 -0
package/dist/history.d.ts +79 -0
package/dist/history.d.ts.map +1 -0
package/dist/history.js +313 -0
package/dist/history.js.map +1 -0
package/dist/html.d.ts +11 -0
package/dist/html.d.ts.map +1 -0
package/dist/html.js +463 -0
package/dist/html.js.map +1 -0
package/dist/impact.d.ts +42 -0
package/dist/impact.d.ts.map +1 -0
package/dist/impact.js +443 -0
package/dist/impact.js.map +1 -0
package/dist/index.d.ts +26 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +34 -0
package/dist/index.js.map +1 -0
package/dist/insights.d.ts +5 -0
package/dist/insights.d.ts.map +1 -0
package/dist/insights.js +271 -0
package/dist/insights.js.map +1 -0
package/dist/joiner.d.ts +9 -0
package/dist/joiner.d.ts.map +1 -0
package/dist/joiner.js +247 -0
package/dist/joiner.js.map +1 -0
package/dist/orchestrator.d.ts +34 -0
package/dist/orchestrator.d.ts.map +1 -0
package/dist/orchestrator.js +827 -0
package/dist/orchestrator.js.map +1 -0
package/dist/pdf.d.ts +26 -0
package/dist/pdf.d.ts.map +1 -0
package/dist/pdf.js +84 -0
package/dist/pdf.js.map +1 -0
package/dist/prediction.d.ts +33 -0
package/dist/prediction.d.ts.map +1 -0
package/dist/prediction.js +316 -0
package/dist/prediction.js.map +1 -0
package/dist/prompts/loader.d.ts +38 -0
package/dist/prompts/loader.d.ts.map +1 -0
package/dist/prompts/loader.js +60 -0
package/dist/prompts/loader.js.map +1 -0
package/dist/renderer.d.ts +64 -0
package/dist/renderer.d.ts.map +1 -0
package/dist/renderer.js +923 -0
package/dist/renderer.js.map +1 -0
package/dist/runid.d.ts +57 -0
package/dist/runid.d.ts.map +1 -0
package/dist/runid.js +199 -0
package/dist/runid.js.map +1 -0
package/dist/runtime.d.ts +29 -0
package/dist/runtime.d.ts.map +1 -0
package/dist/runtime.js +366 -0
package/dist/runtime.js.map +1 -0
package/dist/scanner.d.ts +11 -0
package/dist/scanner.d.ts.map +1 -0
package/dist/scanner.js +426 -0
package/dist/scanner.js.map +1 -0
package/dist/templates.d.ts +120 -0
package/dist/templates.d.ts.map +1 -0
package/dist/templates.js +429 -0
package/dist/templates.js.map +1 -0
package/dist/tools/index.d.ts +153 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +177 -0
package/dist/tools/index.js.map +1 -0
package/dist/types.d.ts +3647 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +703 -0
package/dist/types.js.map +1 -0
package/dist/version.d.ts +7 -0
package/dist/version.d.ts.map +1 -0
package/dist/version.js +23 -0
package/dist/version.js.map +1 -0
package/docs/demo-guide.md +423 -0
package/docs/events-format.md +295 -0
package/docs/inferencemap-spec.md +344 -0
package/docs/migration-v2.md +293 -0
package/fixtures/demo/precomputed.json +142 -0
package/fixtures/demo-project/README.md +52 -0
package/fixtures/demo-project/ai-service.ts +65 -0
package/fixtures/demo-project/sample-events.jsonl +15 -0
package/fixtures/demo-project/src/ai-service.ts +128 -0
package/fixtures/demo-project/src/llm-client.ts +155 -0
package/package.json +65 -0
package/prompts/agent-analyzer.yaml +47 -0
package/prompts/ci-gate.yaml +98 -0
package/prompts/correlation-analyzer.yaml +178 -0
package/prompts/format-normalizer.yaml +46 -0
package/prompts/peak-performance.yaml +180 -0
package/prompts/pr-comment.yaml +111 -0
package/prompts/runtime-analyzer.yaml +189 -0
package/prompts/unified-analyzer.yaml +241 -0
package/schemas/inference-map.v0.1.json +215 -0
package/scripts/benchmark.ts +394 -0
package/scripts/demo-v1.5.sh +158 -0
package/scripts/sync-from-site.sh +197 -0
package/scripts/validate-sync.sh +178 -0
package/src/agent-analyzer.ts +481 -0
package/src/agent.ts +1232 -0
package/src/agents/correlation-analyzer.ts +353 -0
package/src/agents/index.ts +235 -0
package/src/agents/runtime-analyzer.ts +343 -0
package/src/analysis-types.ts +558 -0
package/src/analytics.ts +100 -0
package/src/analyzer.ts +692 -0
package/src/artifacts.ts +218 -0
package/src/benchmarks/index.ts +309 -0
package/src/cli.ts +503 -0
package/src/commands/ci.ts +336 -0
package/src/commands/config.ts +288 -0
package/src/commands/demo.ts +175 -0
package/src/commands/export.ts +297 -0
package/src/commands/history.ts +425 -0
package/src/commands/template.ts +385 -0
package/src/commands/validate-map.ts +324 -0
package/src/commands/whatif.ts +272 -0
package/src/comparison.ts +283 -0
package/src/config.ts +188 -0
package/src/connectors/helicone.ts +164 -0
package/src/connectors/index.ts +93 -0
package/src/connectors/langsmith.ts +179 -0
package/src/connectors/types.ts +180 -0
package/src/cost-estimator.ts +146 -0
package/src/costs.ts +347 -0
package/src/counterfactuals.ts +516 -0
package/src/enhancement-prompts.ts +118 -0
package/src/envelopes.ts +814 -0
package/src/format-normalizer.ts +1486 -0
package/src/history.ts +400 -0
package/src/html.ts +512 -0
package/src/impact.ts +522 -0
package/src/index.ts +83 -0
package/src/insights.ts +341 -0
package/src/joiner.ts +289 -0
package/src/orchestrator.ts +1015 -0
package/src/pdf.ts +110 -0
package/src/prediction.ts +392 -0
package/src/prompts/loader.ts +88 -0
package/src/renderer.ts +1045 -0
package/src/runid.ts +261 -0
package/src/runtime.ts +450 -0
package/src/scanner.ts +508 -0
package/src/templates.ts +561 -0
package/src/tools/index.ts +214 -0
package/src/types.ts +873 -0
package/src/version.ts +24 -0
package/templates/context-accumulation.yaml +23 -0
package/templates/cost-concentration.yaml +20 -0
package/templates/dead-code.yaml +20 -0
package/templates/latency-explainer.yaml +23 -0
package/templates/optimizations/ab-testing-framework.yaml +74 -0
package/templates/optimizations/api-gateway-optimization.yaml +81 -0
package/templates/optimizations/api-model-routing-strategy.yaml +126 -0
package/templates/optimizations/auto-scaling-optimization.yaml +85 -0
package/templates/optimizations/batch-utilization-diagnostic.yaml +142 -0
package/templates/optimizations/comprehensive-apm.yaml +76 -0
package/templates/optimizations/context-window-optimization.yaml +91 -0
package/templates/optimizations/cost-sensitive-batch-processing.yaml +77 -0
package/templates/optimizations/distributed-training-optimization.yaml +77 -0
package/templates/optimizations/document-analysis-edge.yaml +77 -0
package/templates/optimizations/document-pipeline-optimization.yaml +78 -0
package/templates/optimizations/domain-specific-distillation.yaml +78 -0
package/templates/optimizations/error-handling-optimization.yaml +76 -0
package/templates/optimizations/gptq-4bit-quantization.yaml +96 -0
package/templates/optimizations/long-context-memory-management.yaml +78 -0
package/templates/optimizations/max-tokens-optimization.yaml +76 -0
package/templates/optimizations/memory-bandwidth-optimization.yaml +73 -0
package/templates/optimizations/multi-framework-resilience.yaml +75 -0
package/templates/optimizations/multi-tenant-optimization.yaml +75 -0
package/templates/optimizations/prompt-caching-optimization.yaml +143 -0
package/templates/optimizations/pytorch-to-onnx-migration.yaml +109 -0
package/templates/optimizations/quality-monitoring.yaml +74 -0
package/templates/optimizations/realtime-budget-controls.yaml +74 -0
package/templates/optimizations/realtime-latency-optimization.yaml +74 -0
package/templates/optimizations/sglang-concurrency-optimization.yaml +78 -0
package/templates/optimizations/smart-model-routing.yaml +96 -0
package/templates/optimizations/streaming-batch-selection.yaml +167 -0
package/templates/optimizations/system-prompt-optimization.yaml +75 -0
package/templates/optimizations/tensorrt-llm-performance.yaml +77 -0
package/templates/optimizations/vllm-high-throughput-optimization.yaml +93 -0
package/templates/optimizations/vllm-migration-memory-bound.yaml +78 -0
package/templates/overpowered-extraction.yaml +32 -0
package/templates/overpowered-model.yaml +31 -0
package/templates/prompt-bloat.yaml +24 -0
package/templates/retry-explosion.yaml +28 -0
package/templates/schema/insight.schema.json +113 -0
package/templates/schema/optimization.schema.json +180 -0
package/templates/streaming-drift.yaml +30 -0
package/templates/throughput-gap.yaml +21 -0
package/templates/token-underutilization.yaml +28 -0
package/templates/untested-fallback.yaml +21 -0
package/tests/accuracy/drift-detection.test.ts +184 -0
package/tests/accuracy/false-positives.test.ts +166 -0
package/tests/accuracy/templates.test.ts +205 -0
package/tests/action/commands.test.ts +125 -0
package/tests/action/comments.test.ts +347 -0
package/tests/cli.test.ts +203 -0
package/tests/comparison.test.ts +309 -0
package/tests/correlation-analyzer.test.ts +534 -0
package/tests/counterfactuals.test.ts +347 -0
package/tests/fixtures/events/missing-id.jsonl +1 -0
package/tests/fixtures/events/missing-input.jsonl +1 -0
package/tests/fixtures/events/missing-latency.jsonl +1 -0
package/tests/fixtures/events/missing-model.jsonl +1 -0
package/tests/fixtures/events/missing-output.jsonl +1 -0
package/tests/fixtures/events/missing-provider.jsonl +1 -0
package/tests/fixtures/events/missing-ts.jsonl +1 -0
package/tests/fixtures/events/valid.csv +3 -0
package/tests/fixtures/events/valid.json +1 -0
package/tests/fixtures/events/valid.jsonl +2 -0
package/tests/fixtures/events/with-callsite.jsonl +1 -0
package/tests/fixtures/events/with-intent.jsonl +1 -0
package/tests/fixtures/events/wrong-type.jsonl +1 -0
package/tests/fixtures/repos/empty/.gitkeep +0 -0
package/tests/fixtures/repos/hybrid-router/router.py +35 -0
package/tests/fixtures/repos/saas-anthropic/agent.ts +27 -0
package/tests/fixtures/repos/saas-openai/assistant.js +33 -0
package/tests/fixtures/repos/saas-openai/client.py +26 -0
package/tests/fixtures/repos/self-hosted-vllm/inference.py +22 -0
package/tests/github-action.test.ts +292 -0
package/tests/insights.test.ts +878 -0
package/tests/joiner.test.ts +168 -0
package/tests/performance/action-latency.test.ts +132 -0
package/tests/performance/benchmark.test.ts +189 -0
package/tests/performance/cli-latency.test.ts +102 -0
package/tests/pr-comment.test.ts +313 -0
package/tests/prediction.test.ts +296 -0
package/tests/runtime-analyzer.test.ts +375 -0
package/tests/runtime.test.ts +205 -0
package/tests/scanner.test.ts +122 -0
package/tests/template-conformance.test.ts +526 -0
package/tests/unit/cost-calculator.test.ts +303 -0
package/tests/unit/credits.test.ts +180 -0
package/tests/unit/inference-map.test.ts +276 -0
package/tests/unit/schema.test.ts +300 -0
package/tsconfig.json +20 -0
package/vitest.config.ts +14 -0

package/docs/events-format.md ADDED Viewed

@@ -0,0 +1,295 @@
+# Runtime Events Format
+PeakInfer correlates your code with runtime behavior. This document describes how to format runtime event data for drift detection.
+## Quick Start
+Export your LLM inference events as JSONL (newline-delimited JSON):
+```jsonl
+{"id":"evt_1","ts":"2024-12-21T10:00:00Z","provider":"openai","model":"gpt-4","input_tokens":150,"output_tokens":50,"latency_ms":1200}
+{"id":"evt_2","ts":"2024-12-21T10:00:01Z","provider":"anthropic","model":"claude-3-opus","input_tokens":200,"output_tokens":100,"latency_ms":2500}
+```
+Save to a file (e.g., `events.jsonl`) and pass to PeakInfer:
+```bash
+# CLI
+peakinfer analyze ./src --events events.jsonl
+# GitHub Action
+- uses: kalmantic/peakinfer@v1
+  with:
+    path: ./src
+    events: ./events.jsonl
+```
+---
+## InferenceEvent Schema
+Each event represents one LLM inference call:
+| Field | Type | Required | Description |
+|-------|------|----------|-------------|
+| `id` | string | Yes | Unique event identifier |
+| `ts` | string | Yes | ISO 8601 timestamp |
+| `provider` | string | Yes | Provider name (see below) |
+| `model` | string | Yes | Model name |
+| `input_tokens` | number | Yes | Input token count |
+| `output_tokens` | number | Yes | Output token count |
+| `latency_ms` | number | Yes | Total latency in milliseconds |
+| `intent` | string | No | Business intent (e.g., "summarize", "translate") |
+| `callsite_id` | string | No | Link to code location (improves correlation) |
+| `streaming` | boolean | No | Was this a streaming request? |
+| `ttft_ms` | number | No | Time to first token (streaming only) |
+| `batch_size` | number | No | Batch size if batched |
+| `batch_id` | string | No | Batch group identifier |
+| `cached` | boolean | No | Was response cached? |
+| `retry_count` | number | No | Number of retries |
+| `fallback_used` | boolean | No | Was fallback triggered? |
+| `original_model` | string | No | Original model if fallback used |
+---
+## Provider Names
+Use lowercase provider names:
+| Provider | Value |
+|----------|-------|
+| OpenAI | `openai` |
+| Anthropic | `anthropic` |
+| Google | `google` |
+| Azure OpenAI | `azure_openai` |
+| AWS Bedrock | `bedrock` |
+| Cohere | `cohere` |
+| Mistral | `mistral` |
+| Together AI | `together` |
+| Fireworks | `fireworks` |
+| Groq | `groq` |
+| Replicate | `replicate` |
+| Perplexity | `perplexity` |
+| vLLM | `vllm` |
+| SGLang | `sglang` |
+| TGI | `tgi` |
+| Ollama | `ollama` |
+| llama.cpp | `llamacpp` |
+---
+## Supported Formats
+PeakInfer auto-detects the following formats:
+### Direct Parse (No LLM Needed)
+| Format | Extension | Description |
+|--------|-----------|-------------|
+| JSONL | `.jsonl` | Newline-delimited JSON (preferred) |
+| JSON Array | `.json` | Array of event objects |
+| CSV | `.csv` | Comma-separated values |
+| TSV | `.tsv` | Tab-separated values |
+### Agent-Normalized (Requires API Key)
+PeakInfer can parse exports from observability platforms:
+| Platform | Notes |
+|----------|-------|
+| OpenTelemetry | OTLP traces/spans |
+| Jaeger | Distributed tracing format |
+| Zipkin | Tracing format |
+| LangSmith | Trace exports |
+| Helicone | Proxy logs |
+| LiteLLM | Proxy event logs |
+| Portkey | Gateway logs |
+For these formats, provide your Anthropic API key:
+```bash
+export ANTHROPIC_API_KEY=sk-ant-...
+peakinfer analyze ./src --events otel-traces.json
+```
+---
+## CSV/TSV Column Names
+For CSV/TSV files, use these column names:
+```csv
+id,ts,provider,model,input_tokens,output_tokens,latency_ms,streaming
+evt_1,2024-12-21T10:00:00Z,openai,gpt-4,150,50,1200,false
+evt_2,2024-12-21T10:00:01Z,anthropic,claude-3-opus,200,100,2500,true
+```
+Alternative column names are supported:
+- `timestamp` → `ts`
+- `provider_name` → `provider`
+- `model_name` → `model`
+- `tokens_in` → `input_tokens`
+- `tokens_out` → `output_tokens`
+- `latency`, `duration_ms` → `latency_ms`
+---
+## Linking Events to Code
+For better correlation, add `callsite_id` to events matching your code locations:
+```jsonl
+{"id":"evt_1","ts":"2024-12-21T10:00:00Z","provider":"openai","model":"gpt-4","input_tokens":150,"output_tokens":50,"latency_ms":1200,"callsite_id":"src/services/chat.ts:42"}
+```
+PeakInfer will match this to the inference point at `src/services/chat.ts:42`.
+---
+## Drift Detection
+When runtime data is provided, PeakInfer detects drift between code and runtime:
+| Drift Type | Description |
+|------------|-------------|
+| `codeOnly` | Inference point in code but never called |
+| `runtimeOnly` | Runtime calls with no matching code location |
+| `mismatch` | Model/provider differs between code and runtime |
+| `patternDrift` | Pattern mismatch (e.g., streaming in code, blocking in runtime) |
+Example PR comment:
+```
+🔒 RUNTIME CORRELATION
+| Location | Code | Runtime | Drift |
+|----------|------|---------|-------|
+| chat.ts:42 | streaming: true | streaming: 0% | patternDrift |
+| api.ts:15 | gpt-4 | gpt-4-turbo | mismatch |
+```
+---
+## GitHub Action Integration
+### From File in Repository
+```yaml
+- uses: kalmantic/peakinfer@v1
+  with:
+    path: ./src
+    events: ./traces/events.jsonl
+```
+### From URL
+Fetch events from your observability platform:
+```yaml
+- uses: kalmantic/peakinfer@v1
+  with:
+    path: ./src
+    events-url: ${{ secrets.OBSERVABILITY_URL }}
+```
+### From GitHub Artifact
+If events are produced by a previous job:
+```yaml
+- uses: actions/download-artifact@v4
+  with:
+    name: inference-events
+- uses: kalmantic/peakinfer@v1
+  with:
+    path: ./src
+    events: ./inference-events/events.jsonl
+```
+---
+## Generating Events
+### OpenAI SDK (Python)
+```python
+import json
+import time
+from openai import OpenAI
+client = OpenAI()
+events = []
+start = time.time()
+response = client.chat.completions.create(
+    model="gpt-4",
+    messages=[{"role": "user", "content": "Hello"}]
+)
+latency = (time.time() - start) * 1000
+events.append({
+    "id": response.id,
+    "ts": time.strftime("%Y-%m-%dT%H:%M:%SZ", time.gmtime()),
+    "provider": "openai",
+    "model": response.model,
+    "input_tokens": response.usage.prompt_tokens,
+    "output_tokens": response.usage.completion_tokens,
+    "latency_ms": int(latency),
+    "streaming": False,
+})
+# Write to JSONL
+with open("events.jsonl", "a") as f:
+    f.write(json.dumps(events[-1]) + "\n")
+```
+### Anthropic SDK (Python)
+```python
+import json
+import time
+import anthropic
+client = anthropic.Anthropic()
+events = []
+start = time.time()
+response = client.messages.create(
+    model="claude-3-opus-20240229",
+    max_tokens=1024,
+    messages=[{"role": "user", "content": "Hello"}]
+)
+latency = (time.time() - start) * 1000
+events.append({
+    "id": response.id,
+    "ts": time.strftime("%Y-%m-%dT%H:%M:%SZ", time.gmtime()),
+    "provider": "anthropic",
+    "model": response.model,
+    "input_tokens": response.usage.input_tokens,
+    "output_tokens": response.usage.output_tokens,
+    "latency_ms": int(latency),
+    "streaming": False,
+})
+with open("events.jsonl", "a") as f:
+    f.write(json.dumps(events[-1]) + "\n")
+```
+---
+## Best Practices
+1. **Export regularly**: Run event exports as part of your CI/CD pipeline
+2. **Include callsite_id**: Improves code-to-runtime correlation accuracy
+3. **Keep events recent**: Use last 24-48 hours of data for meaningful drift detection
+4. **Use streaming field**: Critical for detecting streaming drift
+5. **Track retries**: Helps identify reliability issues
+---
+## Related
+- [InferenceMap Spec](inferencemap-spec.md) — Output schema for analysis results
+- [README](../README.md) — Quick start guide

package/docs/inferencemap-spec.md ADDED Viewed

@@ -0,0 +1,344 @@
+# InferenceMap v0.1 Specification
+The InferenceMap is PeakInfer's structured output format for static analysis results. It provides a machine-readable representation of all LLM inference points in a codebase.
+## Overview
+```json
+{
+  "version": "0.1",
+  "root": "./src",
+  "generatedAt": "2024-12-21T10:00:00Z",
+  "metadata": { ... },
+  "summary": { ... },
+  "callsites": [ ... ]
+}
+```
+---
+## Top-Level Fields
+| Field | Type | Description |
+|-------|------|-------------|
+| `version` | string | Schema version (currently `"0.1"`) |
+| `root` | string | Analyzed path (relative or absolute) |
+| `generatedAt` | string | ISO 8601 timestamp |
+| `metadata` | object | Analysis context (optional) |
+| `summary` | object | Aggregate statistics |
+| `callsites` | array | List of inference points |
+---
+## Metadata Object
+Optional context about how the analysis was performed:
+```json
+{
+  "metadata": {
+    "absolutePath": "/Users/dev/project/src",
+    "promptId": "unified-analyzer",
+    "promptVersion": "1.6.0",
+    "templatesVersion": "1.0.0",
+    "llmProvider": "anthropic",
+    "llmModel": "claude-sonnet-4-20250514"
+  }
+}
+```
+| Field | Type | Description |
+|-------|------|-------------|
+| `absolutePath` | string | Full absolute path analyzed |
+| `promptId` | string | Analysis prompt identifier |
+| `promptVersion` | string | Analysis prompt version |
+| `templatesVersion` | string | peakinfer-templates version |
+| `llmProvider` | string | LLM provider used (`anthropic`, `none`) |
+| `llmModel` | string | LLM model used for analysis |
+---
+## Summary Object
+Aggregate statistics for quick overview:
+```json
+{
+  "summary": {
+    "totalCallsites": 7,
+    "providers": ["openai", "anthropic"],
+    "models": ["gpt-4", "claude-3-opus"],
+    "patterns": {
+      "streaming": 3,
+      "batching": 0,
+      "retries": 5,
+      "caching": 1,
+      "fallback": 2
+    }
+  }
+}
+```
+| Field | Type | Description |
+|-------|------|-------------|
+| `totalCallsites` | number | Total inference points detected |
+| `providers` | string[] | Unique providers found |
+| `models` | string[] | Unique models found |
+| `patterns` | object | Count of each pattern detected |
+---
+## Callsite Object
+Each inference point (callsite) has this structure:
+```json
+{
+  "id": "src/services/chat.ts:42",
+  "file": "src/services/chat.ts",
+  "line": 42,
+  "provider": "openai",
+  "model": "gpt-4",
+  "framework": "langchain",
+  "runtime": null,
+  "patterns": {
+    "streaming": true,
+    "batching": false,
+    "retries": true,
+    "caching": false,
+    "fallback": true
+  },
+  "confidence": 0.95
+}
+```
+### Required Fields
+| Field | Type | Description |
+|-------|------|-------------|
+| `id` | string | Unique identifier (typically `file:line`) |
+| `file` | string | File path (relative to root) |
+| `line` | number | Line number |
+| `provider` | string \| null | Provider name |
+| `model` | string \| null | Model name |
+| `framework` | string \| null | Framework (langchain, llamaindex, etc.) |
+| `runtime` | string \| null | Runtime (vllm, tgi, etc.) |
+| `patterns` | object | Detected code patterns |
+| `confidence` | number | Detection confidence (0-1) |
+### Patterns Object
+| Pattern | Type | Description |
+|---------|------|-------------|
+| `streaming` | boolean | Streaming enabled in code |
+| `batching` | boolean | Batch processing detected |
+| `retries` | boolean | Retry logic present |
+| `caching` | boolean | Caching implemented |
+| `fallback` | boolean | Fallback logic present |
+---
+## Provider Values
+Valid provider values:
+```typescript
+type Provider =
+  | 'openai'
+  | 'anthropic'
+  | 'google'
+  | 'cohere'
+  | 'mistral'
+  | 'bedrock'
+  | 'azure_openai'
+  | 'together'
+  | 'fireworks'
+  | 'groq'
+  | 'replicate'
+  | 'perplexity'
+  | 'vllm'
+  | 'sglang'
+  | 'tgi'
+  | 'ollama'
+  | 'llamacpp'
+  | 'unknown';
+```
+---
+## Complete Example
+```json
+{
+  "version": "0.1",
+  "root": "./src",
+  "generatedAt": "2024-12-21T10:00:00.000Z",
+  "metadata": {
+    "absolutePath": "/Users/dev/project/src",
+    "llmProvider": "anthropic",
+    "llmModel": "claude-sonnet-4-20250514"
+  },
+  "summary": {
+    "totalCallsites": 3,
+    "providers": ["openai", "anthropic"],
+    "models": ["gpt-4", "gpt-4-turbo", "claude-3-opus"],
+    "patterns": {
+      "streaming": 2,
+      "batching": 0,
+      "retries": 2,
+      "caching": 1,
+      "fallback": 1
+    }
+  },
+  "callsites": [
+    {
+      "id": "src/services/chat.ts:42",
+      "file": "src/services/chat.ts",
+      "line": 42,
+      "provider": "openai",
+      "model": "gpt-4",
+      "framework": null,
+      "runtime": null,
+      "patterns": {
+        "streaming": true,
+        "batching": false,
+        "retries": true,
+        "caching": false,
+        "fallback": false
+      },
+      "confidence": 0.95
+    },
+    {
+      "id": "src/services/summarize.ts:15",
+      "file": "src/services/summarize.ts",
+      "line": 15,
+      "provider": "openai",
+      "model": "gpt-4-turbo",
+      "framework": "langchain",
+      "runtime": null,
+      "patterns": {
+        "streaming": false,
+        "batching": false,
+        "retries": true,
+        "caching": true,
+        "fallback": true
+      },
+      "confidence": 0.88
+    },
+    {
+      "id": "src/api/translate.ts:78",
+      "file": "src/api/translate.ts",
+      "line": 78,
+      "provider": "anthropic",
+      "model": "claude-3-opus",
+      "framework": null,
+      "runtime": null,
+      "patterns": {
+        "streaming": true,
+        "batching": false,
+        "retries": false,
+        "caching": false,
+        "fallback": false
+      },
+      "confidence": 0.92
+    }
+  ]
+}
+```
+---
+## Usage
+### CLI Output
+Generate InferenceMap with the CLI:
+```bash
+# Save to file
+peakinfer analyze ./src --json > inference-map.json
+# Or use built-in artifact saving
+peakinfer analyze ./src --save
+# Creates .peakinfer/inference-map.json
+```
+### Programmatic Access (TypeScript)
+```typescript
+import { InferenceMap } from '@kalmantic/peakinfer';
+import fs from 'fs';
+const map: InferenceMap = JSON.parse(
+  fs.readFileSync('.peakinfer/inference-map.json', 'utf-8')
+);
+console.log(`Found ${map.summary.totalCallsites} inference points`);
+for (const callsite of map.callsites) {
+  if (!callsite.patterns.retries) {
+    console.log(`Missing retries: ${callsite.id}`);
+  }
+}
+```
+### Zod Schema Validation
+```typescript
+import { InferenceMap as InferenceMapSchema } from '@kalmantic/peakinfer';
+// Validate JSON against schema
+const result = InferenceMapSchema.safeParse(jsonData);
+if (!result.success) {
+  console.error('Invalid InferenceMap:', result.error);
+}
+```
+---
+## Versioning
+The `version` field indicates the schema version:
+| Version | Description |
+|---------|-------------|
+| `0.1` | Initial specification (current) |
+Future versions will maintain backward compatibility where possible.
+---
+## TypeScript Definition
+The full Zod schema is available in `src/types.ts`:
+```typescript
+export const InferenceMap = z.object({
+  version: z.string(),
+  root: z.string(),
+  generatedAt: z.string(),
+  metadata: z.object({
+    absolutePath: z.string(),
+    promptId: z.string().optional(),
+    promptVersion: z.string().optional(),
+    templatesVersion: z.string().optional(),
+    llmProvider: z.string().optional(),
+    llmModel: z.string().optional(),
+  }).optional(),
+  summary: z.object({
+    totalCallsites: z.number(),
+    providers: z.array(z.string()),
+    models: z.array(z.string()),
+    patterns: z.record(z.number()),
+  }),
+  callsites: z.array(Callsite),
+});
+```
+---
+## Related
+- [Runtime Events Format](events-format.md) — Input schema for runtime correlation
+- [README](../README.md) — Quick start guide