npm - @peakinfer/cli - Versions diffs - 1.0.133 - Mend

@peakinfer/cli 1.0.133

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (367) hide show

package/.claude/settings.local.json +8 -0
package/.env.example +6 -0
package/.github/workflows/peakinfer.yml +64 -0
package/CHANGELOG.md +31 -0
package/LICENSE +190 -0
package/README.md +335 -0
package/data/inferencemax.json +274 -0
package/dist/agent-analyzer.d.ts +45 -0
package/dist/agent-analyzer.d.ts.map +1 -0
package/dist/agent-analyzer.js +374 -0
package/dist/agent-analyzer.js.map +1 -0
package/dist/agent.d.ts +76 -0
package/dist/agent.d.ts.map +1 -0
package/dist/agent.js +965 -0
package/dist/agent.js.map +1 -0
package/dist/agents/correlation-analyzer.d.ts +34 -0
package/dist/agents/correlation-analyzer.d.ts.map +1 -0
package/dist/agents/correlation-analyzer.js +261 -0
package/dist/agents/correlation-analyzer.js.map +1 -0
package/dist/agents/index.d.ts +91 -0
package/dist/agents/index.d.ts.map +1 -0
package/dist/agents/index.js +111 -0
package/dist/agents/index.js.map +1 -0
package/dist/agents/runtime-analyzer.d.ts +38 -0
package/dist/agents/runtime-analyzer.d.ts.map +1 -0
package/dist/agents/runtime-analyzer.js +244 -0
package/dist/agents/runtime-analyzer.js.map +1 -0
package/dist/analysis-types.d.ts +500 -0
package/dist/analysis-types.d.ts.map +1 -0
package/dist/analysis-types.js +11 -0
package/dist/analysis-types.js.map +1 -0
package/dist/analytics.d.ts +25 -0
package/dist/analytics.d.ts.map +1 -0
package/dist/analytics.js +94 -0
package/dist/analytics.js.map +1 -0
package/dist/analyzer.d.ts +48 -0
package/dist/analyzer.d.ts.map +1 -0
package/dist/analyzer.js +547 -0
package/dist/analyzer.js.map +1 -0
package/dist/artifacts.d.ts +44 -0
package/dist/artifacts.d.ts.map +1 -0
package/dist/artifacts.js +165 -0
package/dist/artifacts.js.map +1 -0
package/dist/benchmarks/index.d.ts +88 -0
package/dist/benchmarks/index.d.ts.map +1 -0
package/dist/benchmarks/index.js +205 -0
package/dist/benchmarks/index.js.map +1 -0
package/dist/cli.d.ts +3 -0
package/dist/cli.d.ts.map +1 -0
package/dist/cli.js +427 -0
package/dist/cli.js.map +1 -0
package/dist/commands/ci.d.ts +19 -0
package/dist/commands/ci.d.ts.map +1 -0
package/dist/commands/ci.js +253 -0
package/dist/commands/ci.js.map +1 -0
package/dist/commands/config.d.ts +16 -0
package/dist/commands/config.d.ts.map +1 -0
package/dist/commands/config.js +249 -0
package/dist/commands/config.js.map +1 -0
package/dist/commands/demo.d.ts +15 -0
package/dist/commands/demo.d.ts.map +1 -0
package/dist/commands/demo.js +106 -0
package/dist/commands/demo.js.map +1 -0
package/dist/commands/export.d.ts +14 -0
package/dist/commands/export.d.ts.map +1 -0
package/dist/commands/export.js +209 -0
package/dist/commands/export.js.map +1 -0
package/dist/commands/history.d.ts +15 -0
package/dist/commands/history.d.ts.map +1 -0
package/dist/commands/history.js +389 -0
package/dist/commands/history.js.map +1 -0
package/dist/commands/template.d.ts +14 -0
package/dist/commands/template.d.ts.map +1 -0
package/dist/commands/template.js +341 -0
package/dist/commands/template.js.map +1 -0
package/dist/commands/validate-map.d.ts +12 -0
package/dist/commands/validate-map.d.ts.map +1 -0
package/dist/commands/validate-map.js +274 -0
package/dist/commands/validate-map.js.map +1 -0
package/dist/commands/whatif.d.ts +17 -0
package/dist/commands/whatif.d.ts.map +1 -0
package/dist/commands/whatif.js +206 -0
package/dist/commands/whatif.js.map +1 -0
package/dist/comparison.d.ts +38 -0
package/dist/comparison.d.ts.map +1 -0
package/dist/comparison.js +223 -0
package/dist/comparison.js.map +1 -0
package/dist/config.d.ts +42 -0
package/dist/config.d.ts.map +1 -0
package/dist/config.js +158 -0
package/dist/config.js.map +1 -0
package/dist/connectors/helicone.d.ts +9 -0
package/dist/connectors/helicone.d.ts.map +1 -0
package/dist/connectors/helicone.js +106 -0
package/dist/connectors/helicone.js.map +1 -0
package/dist/connectors/index.d.ts +37 -0
package/dist/connectors/index.d.ts.map +1 -0
package/dist/connectors/index.js +65 -0
package/dist/connectors/index.js.map +1 -0
package/dist/connectors/langsmith.d.ts +9 -0
package/dist/connectors/langsmith.d.ts.map +1 -0
package/dist/connectors/langsmith.js +122 -0
package/dist/connectors/langsmith.js.map +1 -0
package/dist/connectors/types.d.ts +83 -0
package/dist/connectors/types.d.ts.map +1 -0
package/dist/connectors/types.js +98 -0
package/dist/connectors/types.js.map +1 -0
package/dist/cost-estimator.d.ts +46 -0
package/dist/cost-estimator.d.ts.map +1 -0
package/dist/cost-estimator.js +104 -0
package/dist/cost-estimator.js.map +1 -0
package/dist/costs.d.ts +57 -0
package/dist/costs.d.ts.map +1 -0
package/dist/costs.js +251 -0
package/dist/costs.js.map +1 -0
package/dist/counterfactuals.d.ts +29 -0
package/dist/counterfactuals.d.ts.map +1 -0
package/dist/counterfactuals.js +448 -0
package/dist/counterfactuals.js.map +1 -0
package/dist/enhancement-prompts.d.ts +41 -0
package/dist/enhancement-prompts.d.ts.map +1 -0
package/dist/enhancement-prompts.js +88 -0
package/dist/enhancement-prompts.js.map +1 -0
package/dist/envelopes.d.ts +20 -0
package/dist/envelopes.d.ts.map +1 -0
package/dist/envelopes.js +790 -0
package/dist/envelopes.js.map +1 -0
package/dist/format-normalizer.d.ts +71 -0
package/dist/format-normalizer.d.ts.map +1 -0
package/dist/format-normalizer.js +1331 -0
package/dist/format-normalizer.js.map +1 -0
package/dist/history.d.ts +79 -0
package/dist/history.d.ts.map +1 -0
package/dist/history.js +313 -0
package/dist/history.js.map +1 -0
package/dist/html.d.ts +11 -0
package/dist/html.d.ts.map +1 -0
package/dist/html.js +463 -0
package/dist/html.js.map +1 -0
package/dist/impact.d.ts +42 -0
package/dist/impact.d.ts.map +1 -0
package/dist/impact.js +443 -0
package/dist/impact.js.map +1 -0
package/dist/index.d.ts +26 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +34 -0
package/dist/index.js.map +1 -0
package/dist/insights.d.ts +5 -0
package/dist/insights.d.ts.map +1 -0
package/dist/insights.js +271 -0
package/dist/insights.js.map +1 -0
package/dist/joiner.d.ts +9 -0
package/dist/joiner.d.ts.map +1 -0
package/dist/joiner.js +247 -0
package/dist/joiner.js.map +1 -0
package/dist/orchestrator.d.ts +34 -0
package/dist/orchestrator.d.ts.map +1 -0
package/dist/orchestrator.js +827 -0
package/dist/orchestrator.js.map +1 -0
package/dist/pdf.d.ts +26 -0
package/dist/pdf.d.ts.map +1 -0
package/dist/pdf.js +84 -0
package/dist/pdf.js.map +1 -0
package/dist/prediction.d.ts +33 -0
package/dist/prediction.d.ts.map +1 -0
package/dist/prediction.js +316 -0
package/dist/prediction.js.map +1 -0
package/dist/prompts/loader.d.ts +38 -0
package/dist/prompts/loader.d.ts.map +1 -0
package/dist/prompts/loader.js +60 -0
package/dist/prompts/loader.js.map +1 -0
package/dist/renderer.d.ts +64 -0
package/dist/renderer.d.ts.map +1 -0
package/dist/renderer.js +923 -0
package/dist/renderer.js.map +1 -0
package/dist/runid.d.ts +57 -0
package/dist/runid.d.ts.map +1 -0
package/dist/runid.js +199 -0
package/dist/runid.js.map +1 -0
package/dist/runtime.d.ts +29 -0
package/dist/runtime.d.ts.map +1 -0
package/dist/runtime.js +366 -0
package/dist/runtime.js.map +1 -0
package/dist/scanner.d.ts +11 -0
package/dist/scanner.d.ts.map +1 -0
package/dist/scanner.js +426 -0
package/dist/scanner.js.map +1 -0
package/dist/templates.d.ts +120 -0
package/dist/templates.d.ts.map +1 -0
package/dist/templates.js +429 -0
package/dist/templates.js.map +1 -0
package/dist/tools/index.d.ts +153 -0
package/dist/tools/index.d.ts.map +1 -0
package/dist/tools/index.js +177 -0
package/dist/tools/index.js.map +1 -0
package/dist/types.d.ts +3647 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +703 -0
package/dist/types.js.map +1 -0
package/dist/version.d.ts +7 -0
package/dist/version.d.ts.map +1 -0
package/dist/version.js +23 -0
package/dist/version.js.map +1 -0
package/docs/demo-guide.md +423 -0
package/docs/events-format.md +295 -0
package/docs/inferencemap-spec.md +344 -0
package/docs/migration-v2.md +293 -0
package/fixtures/demo/precomputed.json +142 -0
package/fixtures/demo-project/README.md +52 -0
package/fixtures/demo-project/ai-service.ts +65 -0
package/fixtures/demo-project/sample-events.jsonl +15 -0
package/fixtures/demo-project/src/ai-service.ts +128 -0
package/fixtures/demo-project/src/llm-client.ts +155 -0
package/package.json +65 -0
package/prompts/agent-analyzer.yaml +47 -0
package/prompts/ci-gate.yaml +98 -0
package/prompts/correlation-analyzer.yaml +178 -0
package/prompts/format-normalizer.yaml +46 -0
package/prompts/peak-performance.yaml +180 -0
package/prompts/pr-comment.yaml +111 -0
package/prompts/runtime-analyzer.yaml +189 -0
package/prompts/unified-analyzer.yaml +241 -0
package/schemas/inference-map.v0.1.json +215 -0
package/scripts/benchmark.ts +394 -0
package/scripts/demo-v1.5.sh +158 -0
package/scripts/sync-from-site.sh +197 -0
package/scripts/validate-sync.sh +178 -0
package/src/agent-analyzer.ts +481 -0
package/src/agent.ts +1232 -0
package/src/agents/correlation-analyzer.ts +353 -0
package/src/agents/index.ts +235 -0
package/src/agents/runtime-analyzer.ts +343 -0
package/src/analysis-types.ts +558 -0
package/src/analytics.ts +100 -0
package/src/analyzer.ts +692 -0
package/src/artifacts.ts +218 -0
package/src/benchmarks/index.ts +309 -0
package/src/cli.ts +503 -0
package/src/commands/ci.ts +336 -0
package/src/commands/config.ts +288 -0
package/src/commands/demo.ts +175 -0
package/src/commands/export.ts +297 -0
package/src/commands/history.ts +425 -0
package/src/commands/template.ts +385 -0
package/src/commands/validate-map.ts +324 -0
package/src/commands/whatif.ts +272 -0
package/src/comparison.ts +283 -0
package/src/config.ts +188 -0
package/src/connectors/helicone.ts +164 -0
package/src/connectors/index.ts +93 -0
package/src/connectors/langsmith.ts +179 -0
package/src/connectors/types.ts +180 -0
package/src/cost-estimator.ts +146 -0
package/src/costs.ts +347 -0
package/src/counterfactuals.ts +516 -0
package/src/enhancement-prompts.ts +118 -0
package/src/envelopes.ts +814 -0
package/src/format-normalizer.ts +1486 -0
package/src/history.ts +400 -0
package/src/html.ts +512 -0
package/src/impact.ts +522 -0
package/src/index.ts +83 -0
package/src/insights.ts +341 -0
package/src/joiner.ts +289 -0
package/src/orchestrator.ts +1015 -0
package/src/pdf.ts +110 -0
package/src/prediction.ts +392 -0
package/src/prompts/loader.ts +88 -0
package/src/renderer.ts +1045 -0
package/src/runid.ts +261 -0
package/src/runtime.ts +450 -0
package/src/scanner.ts +508 -0
package/src/templates.ts +561 -0
package/src/tools/index.ts +214 -0
package/src/types.ts +873 -0
package/src/version.ts +24 -0
package/templates/context-accumulation.yaml +23 -0
package/templates/cost-concentration.yaml +20 -0
package/templates/dead-code.yaml +20 -0
package/templates/latency-explainer.yaml +23 -0
package/templates/optimizations/ab-testing-framework.yaml +74 -0
package/templates/optimizations/api-gateway-optimization.yaml +81 -0
package/templates/optimizations/api-model-routing-strategy.yaml +126 -0
package/templates/optimizations/auto-scaling-optimization.yaml +85 -0
package/templates/optimizations/batch-utilization-diagnostic.yaml +142 -0
package/templates/optimizations/comprehensive-apm.yaml +76 -0
package/templates/optimizations/context-window-optimization.yaml +91 -0
package/templates/optimizations/cost-sensitive-batch-processing.yaml +77 -0
package/templates/optimizations/distributed-training-optimization.yaml +77 -0
package/templates/optimizations/document-analysis-edge.yaml +77 -0
package/templates/optimizations/document-pipeline-optimization.yaml +78 -0
package/templates/optimizations/domain-specific-distillation.yaml +78 -0
package/templates/optimizations/error-handling-optimization.yaml +76 -0
package/templates/optimizations/gptq-4bit-quantization.yaml +96 -0
package/templates/optimizations/long-context-memory-management.yaml +78 -0
package/templates/optimizations/max-tokens-optimization.yaml +76 -0
package/templates/optimizations/memory-bandwidth-optimization.yaml +73 -0
package/templates/optimizations/multi-framework-resilience.yaml +75 -0
package/templates/optimizations/multi-tenant-optimization.yaml +75 -0
package/templates/optimizations/prompt-caching-optimization.yaml +143 -0
package/templates/optimizations/pytorch-to-onnx-migration.yaml +109 -0
package/templates/optimizations/quality-monitoring.yaml +74 -0
package/templates/optimizations/realtime-budget-controls.yaml +74 -0
package/templates/optimizations/realtime-latency-optimization.yaml +74 -0
package/templates/optimizations/sglang-concurrency-optimization.yaml +78 -0
package/templates/optimizations/smart-model-routing.yaml +96 -0
package/templates/optimizations/streaming-batch-selection.yaml +167 -0
package/templates/optimizations/system-prompt-optimization.yaml +75 -0
package/templates/optimizations/tensorrt-llm-performance.yaml +77 -0
package/templates/optimizations/vllm-high-throughput-optimization.yaml +93 -0
package/templates/optimizations/vllm-migration-memory-bound.yaml +78 -0
package/templates/overpowered-extraction.yaml +32 -0
package/templates/overpowered-model.yaml +31 -0
package/templates/prompt-bloat.yaml +24 -0
package/templates/retry-explosion.yaml +28 -0
package/templates/schema/insight.schema.json +113 -0
package/templates/schema/optimization.schema.json +180 -0
package/templates/streaming-drift.yaml +30 -0
package/templates/throughput-gap.yaml +21 -0
package/templates/token-underutilization.yaml +28 -0
package/templates/untested-fallback.yaml +21 -0
package/tests/accuracy/drift-detection.test.ts +184 -0
package/tests/accuracy/false-positives.test.ts +166 -0
package/tests/accuracy/templates.test.ts +205 -0
package/tests/action/commands.test.ts +125 -0
package/tests/action/comments.test.ts +347 -0
package/tests/cli.test.ts +203 -0
package/tests/comparison.test.ts +309 -0
package/tests/correlation-analyzer.test.ts +534 -0
package/tests/counterfactuals.test.ts +347 -0
package/tests/fixtures/events/missing-id.jsonl +1 -0
package/tests/fixtures/events/missing-input.jsonl +1 -0
package/tests/fixtures/events/missing-latency.jsonl +1 -0
package/tests/fixtures/events/missing-model.jsonl +1 -0
package/tests/fixtures/events/missing-output.jsonl +1 -0
package/tests/fixtures/events/missing-provider.jsonl +1 -0
package/tests/fixtures/events/missing-ts.jsonl +1 -0
package/tests/fixtures/events/valid.csv +3 -0
package/tests/fixtures/events/valid.json +1 -0
package/tests/fixtures/events/valid.jsonl +2 -0
package/tests/fixtures/events/with-callsite.jsonl +1 -0
package/tests/fixtures/events/with-intent.jsonl +1 -0
package/tests/fixtures/events/wrong-type.jsonl +1 -0
package/tests/fixtures/repos/empty/.gitkeep +0 -0
package/tests/fixtures/repos/hybrid-router/router.py +35 -0
package/tests/fixtures/repos/saas-anthropic/agent.ts +27 -0
package/tests/fixtures/repos/saas-openai/assistant.js +33 -0
package/tests/fixtures/repos/saas-openai/client.py +26 -0
package/tests/fixtures/repos/self-hosted-vllm/inference.py +22 -0
package/tests/github-action.test.ts +292 -0
package/tests/insights.test.ts +878 -0
package/tests/joiner.test.ts +168 -0
package/tests/performance/action-latency.test.ts +132 -0
package/tests/performance/benchmark.test.ts +189 -0
package/tests/performance/cli-latency.test.ts +102 -0
package/tests/pr-comment.test.ts +313 -0
package/tests/prediction.test.ts +296 -0
package/tests/runtime-analyzer.test.ts +375 -0
package/tests/runtime.test.ts +205 -0
package/tests/scanner.test.ts +122 -0
package/tests/template-conformance.test.ts +526 -0
package/tests/unit/cost-calculator.test.ts +303 -0
package/tests/unit/credits.test.ts +180 -0
package/tests/unit/inference-map.test.ts +276 -0
package/tests/unit/schema.test.ts +300 -0
package/tsconfig.json +20 -0
package/vitest.config.ts +14 -0

package/src/scanner.ts ADDED Viewed

@@ -0,0 +1,508 @@
+import { glob } from 'glob';
+import ignoreDefault from 'ignore';
+import { readFileSync, existsSync, statSync } from 'fs';
+import { join, relative, extname } from 'path';
+import type { ScanResult, ScanCandidate } from './types.js';
+// Handle ESM default import with type assertion for NodeNext resolution
+const ignore = ignoreDefault as unknown as (options?: { ignorecase?: boolean }) => {
+  add(patterns: string | readonly string[]): void;
+  ignores(pathname: string): boolean;
+};
+interface IgnoreInstance {
+  add(patterns: string | readonly string[]): void;
+  ignores(pathname: string): boolean;
+}
+// =============================================================================
+// CONSTANTS
+// =============================================================================
+const DEFAULT_IGNORES = [
+  'node_modules/**',
+  'dist/**',
+  '.git/**',
+  '__pycache__/**',
+  '*.pyc',
+  '.venv/**',
+  'venv/**',
+  '.env/**',
+  'env/**',
+  'build/**',
+  'target/**',
+  '.next/**',
+  '.nuxt/**',
+  'coverage/**',
+];
+// v1.9.5: Files to skip for cost optimization
+const SKIP_PATTERNS = [
+  // Test files
+  '**/*.test.*',
+  '**/*.spec.*',
+  '**/__tests__/**',
+  '**/test/**',
+  '**/tests/**',
+  '**/*.test.ts',
+  '**/*.test.js',
+  '**/*.spec.ts',
+  '**/*.spec.js',
+  '**/test_*.py',
+  '**/*_test.py',
+  '**/*_test.go',
+  // Config files
+  '**/jest.config.*',
+  '**/vitest.config.*',
+  '**/webpack.config.*',
+  '**/rollup.config.*',
+  '**/vite.config.*',
+  '**/tsconfig.json',
+  '**/package.json',
+  '**/package-lock.json',
+  '**/yarn.lock',
+  '**/pnpm-lock.yaml',
+  // Documentation
+  '**/*.md',
+  '**/docs/**',
+  '**/documentation/**',
+  // Generated files
+  '**/generated/**',
+  '**/*.generated.*',
+  '**/*.d.ts',
+  // Fixtures and mocks
+  '**/fixtures/**',
+  '**/mocks/**',
+  '**/__mocks__/**',
+  '**/snapshots/**',
+  '**/__snapshots__/**',
+];
+// v1.9.5: Maximum file size in bytes (50KB)
+const MAX_FILE_SIZE = 50 * 1024;
+const LANGUAGE_MAP: Record<string, string> = {
+  '.py': 'python',
+  '.ts': 'typescript',
+  '.tsx': 'typescript',
+  '.js': 'javascript',
+  '.jsx': 'javascript',
+  '.mjs': 'javascript',
+  '.cjs': 'javascript',
+  '.go': 'go',
+  '.java': 'java',
+  '.kt': 'kotlin',
+  '.rs': 'rust',
+  '.rb': 'ruby',
+  '.php': 'php',
+  '.cs': 'csharp',
+  '.swift': 'swift',
+  '.scala': 'scala',
+};
+const CODE_EXTENSIONS = Object.keys(LANGUAGE_MAP);
+// Patterns that indicate LLM inference calls
+const INFERENCE_PATTERNS = [
+  // ==========================================================================
+  // OpenAI SDK
+  // ==========================================================================
+  /\.chat\.completions\.create\(/,
+  /openai\.completions\.create\(/,
+  /\.completions\.create\(/,
+  // NOTE: Removed /OpenAI\(\)/ - client initialization, not an inference call
+  // NOTE: Removed /AsyncOpenAI\(\)/ - client initialization, not an inference call
+  /openai\.ChatCompletion\.create\(/,
+  /openai\.Completion\.create\(/,
+  /\.embeddings\.create\(/,  // OpenAI embeddings API
+  // ==========================================================================
+  // Anthropic SDK
+  // ==========================================================================
+  /\.messages\.create\(/,
+  /anthropic\.messages\(/,
+  /\.create_message\(/,
+  // NOTE: Removed /Anthropic\(\)/ - client initialization, not an inference call
+  // NOTE: Removed /AsyncAnthropic\(\)/ - client initialization, not an inference call
+  /anthropic\.completions\(/,
+  // ==========================================================================
+  // Google AI / Vertex AI
+  // ==========================================================================
+  /\.generate_content\(/,
+  /genai\.GenerativeModel\(/,
+  /GenerativeModel\(/,
+  /vertexai\.generative_models/,
+  /aiplatform\.gapic/,
+  // ==========================================================================
+  // Mistral
+  // ==========================================================================
+  /MistralClient\(/,
+  /mistral\.chat\(/,
+  /mistral\.complete\(/,
+  // ==========================================================================
+  // Cohere
+  // ==========================================================================
+  /cohere\.chat\(/,
+  /cohere\.generate\(/,
+  /CohereClient\(/,
+  // ==========================================================================
+  // Together AI
+  // ==========================================================================
+  /together\.chat\./,
+  /Together\(\)/,
+  /together\.completions/,
+  /together_ai/,
+  // ==========================================================================
+  // Fireworks AI
+  // ==========================================================================
+  /fireworks\.chat\./,
+  /Fireworks\(/,
+  /fireworks\.completions/,
+  /fireworks_ai/,
+  // ==========================================================================
+  // Groq
+  // ==========================================================================
+  /groq\.chat\./,
+  /Groq\(\)/,
+  /groq\.completions/,
+  // ==========================================================================
+  // Replicate
+  // ==========================================================================
+  /replicate\.run\(/,
+  /replicate\.predictions\.create\(/,
+  /Replicate\(\)/,
+  // ==========================================================================
+  // Perplexity
+  // ==========================================================================
+  /perplexity\.chat\./,
+  /PerplexityClient\(/,
+  // ==========================================================================
+  // AWS Bedrock
+  // ==========================================================================
+  /bedrock-runtime/,
+  /invoke_model\(/,
+  /InvokeModel/,
+  /BedrockRuntime\(/,
+  /bedrock\.converse\(/,
+  // ==========================================================================
+  // Azure OpenAI
+  // ==========================================================================
+  /AzureOpenAI\(/,
+  /azure\.openai/,
+  /openai\.azure/,
+  // ==========================================================================
+  // LangChain
+  // ==========================================================================
+  /ChatOpenAI\(/,
+  /ChatAnthropic\(/,
+  /ChatGoogleGenerativeAI\(/,
+  /ChatMistralAI\(/,
+  /ChatCohere\(/,
+  /ChatGroq\(/,
+  /ChatFireworks\(/,
+  /ChatTogether\(/,
+  /ChatBedrock\(/,
+  /ChatVertexAI\(/,
+  /ChatOllama\(/,
+  /LLMChain\(/,
+  /ConversationChain\(/,
+  // ==========================================================================
+  // LlamaIndex
+  // ==========================================================================
+  /llama_index\.llms/,
+  /OpenAILike\(/,
+  /Ollama\(/,
+  /LlamaCPP\(/,
+  // ==========================================================================
+  // DSPy Framework
+  // ==========================================================================
+  /dspy\.Predict\(/,
+  /dspy\.ChainOfThought\(/,
+  /dspy\.ProgramOfThought\(/,
+  /dspy\.ReAct\(/,
+  /dspy\.Retrieve\(/,
+  /dspy\.generate\(/,
+  /dspy\.forward\(/,
+  /\.forward\(.*question/,  // DSPy module forward calls with question param
+  // ==========================================================================
+  // vLLM (Self-hosted)
+  // ==========================================================================
+  /vllm\.generate/,
+  /vllm\.LLM\(/,
+  /from vllm import/,
+  /vllm\.SamplingParams/,
+  /vllm\.AsyncLLMEngine/,
+  /vllm\.entrypoints/,
+  /\/v1\/completions/,  // OpenAI-compatible endpoint
+  // ==========================================================================
+  // SGLang (Self-hosted)
+  // ==========================================================================
+  /sglang\.generate/,
+  /sglang\.Engine\(/,
+  /from sglang import/,
+  /sglang\.RuntimeEndpoint/,
+  /sglang\.function/,
+  /sglang\.gen\(/,
+  // ==========================================================================
+  // TGI - Text Generation Inference (Self-hosted)
+  // ==========================================================================
+  /text-generation-inference/,
+  /InferenceClient\(/,
+  /huggingface_hub\.inference/,
+  /text_generation\(/,
+  /HuggingFaceEndpoint\(/,
+  /tgi\.generate/,
+  // ==========================================================================
+  // Ollama (Local inference)
+  // ==========================================================================
+  /ollama\.generate/,
+  /ollama\.chat/,
+  /ollama\.create\(/,
+  /ollama\.pull\(/,
+  /from ollama import/,
+  /Ollama\(\)/,
+  /localhost:11434/,  // Default Ollama port
+  /127\.0\.0\.1:11434/,
+  // ==========================================================================
+  // llama.cpp / llama-cpp-python (Bare metal)
+  // ==========================================================================
+  /llama_cpp/,
+  /Llama\(/,
+  /llama\.generate/,
+  /llama\.create_completion/,
+  /llama\.create_chat_completion/,
+  /from llama_cpp import/,
+  /LlamaCpp\(/,
+  // ==========================================================================
+  // Transformers / HuggingFace (Bare metal)
+  // ==========================================================================
+  /pipeline\("text-generation"/,
+  /pipeline\('text-generation'/,
+  /AutoModelForCausalLM/,
+  /AutoModelForSeq2SeqLM/,
+  /\.generate\(input_ids/,
+  /transformers\.pipeline/,
+  /model\.generate\(/,
+  // ==========================================================================
+  // GGUF / GGML models
+  // ==========================================================================
+  /\.gguf/,
+  /\.ggml/,
+  /ctransformers/,
+  /CTransformers\(/,
+  // ==========================================================================
+  // ExLlama / ExLlamaV2 (Bare metal, GPU optimized)
+  // ==========================================================================
+  /exllama/,
+  /ExLlama/,
+  /exllamav2/,
+  /ExLlamaV2/,
+  // ==========================================================================
+  // Generic patterns (conservative - only match with LLM context)
+  // ==========================================================================
+  // NOTE: Removed overly generic patterns that cause false positives:
+  // - /\.invoke\(/ - too generic, matches any invoke method
+  // - /\.generate\(/ - too generic, matches generators, UUIDs, etc.
+  // - /\.chat\(/ - too generic, matches any chat method
+  // - /llm\./i - case-insensitive, matches "film.", variable names
+  // - /\.llm\(/ - too generic without context
+  // - /LLM\(/ - only keep if clearly a class instantiation
+  /\.ainvoke\(/,  // LangChain async invoke - specific enough
+  /\.complete\(/,  // Usually LLM-specific
+  /ChatModel\(/,   // Usually LLM-specific class
+  /completion_tokens/,  // OpenAI response field
+  /prompt_tokens/,      // OpenAI response field
+];
+// =============================================================================
+// HELPERS
+// =============================================================================
+function detectLanguage(filePath: string): string {
+  const ext = extname(filePath).toLowerCase();
+  return LANGUAGE_MAP[ext] || 'unknown';
+}
+function countLines(content: string): number {
+  if (!content) return 0;
+  return content.split('\n').filter(line => line.trim().length > 0).length;
+}
+function loadGitignore(root: string, skipOptimization = true): IgnoreInstance {
+  const ig = ignore();
+  // Add default ignores
+  ig.add(DEFAULT_IGNORES);
+  // v1.9.5: Add cost optimization skip patterns
+  if (skipOptimization) {
+    ig.add(SKIP_PATTERNS);
+  }
+  // Load .gitignore if exists
+  const gitignorePath = join(root, '.gitignore');
+  if (existsSync(gitignorePath)) {
+    try {
+      const content = readFileSync(gitignorePath, 'utf-8');
+      ig.add(content);
+    } catch {
+      // Ignore errors reading .gitignore
+    }
+  }
+  return ig;
+}
+function findCandidatesInContent(filePath: string, content: string): ScanCandidate[] {
+  const candidates: ScanCandidate[] = [];
+  const lines = content.split('\n');
+  for (let i = 0; i < lines.length; i++) {
+    const line = lines[i];
+    for (const pattern of INFERENCE_PATTERNS) {
+      if (pattern.test(line)) {
+        candidates.push({
+          file: filePath,
+          line: i + 1, // 1-indexed
+          snippet: line.trim().slice(0, 100), // First 100 chars
+        });
+        break; // Only one candidate per line
+      }
+    }
+  }
+  return candidates;
+}
+// =============================================================================
+// PUBLIC API
+// =============================================================================
+export interface ScanOptions {
+  /** Skip test files, configs, etc. for cost optimization (default: true) */
+  skipOptimization?: boolean;
+  /** Maximum file size in bytes (default: 50KB) */
+  maxFileSize?: number;
+  /** Include files even if no inference patterns found */
+  includeAll?: boolean;
+}
+export async function scan(root: string, options: ScanOptions = {}): Promise<ScanResult> {
+  const {
+    skipOptimization = true,
+    maxFileSize = MAX_FILE_SIZE,
+    includeAll = false,
+  } = options;
+  // Validate directory exists
+  if (!existsSync(root)) {
+    throw new Error(`Directory not found: ${root}`);
+  }
+  const stat = statSync(root);
+  if (!stat.isDirectory()) {
+    throw new Error(`Not a directory: ${root}`);
+  }
+  const ig = loadGitignore(root, skipOptimization);
+  // Build glob pattern for code files
+  const patterns = CODE_EXTENSIONS.map(ext => `**/*${ext}`);
+  // Find all matching files
+  const absolutePaths = await glob(patterns, {
+    cwd: root,
+    absolute: true,
+    nodir: true,
+    dot: false,
+  });
+  // Process files
+  const files: ScanResult['files'] = [];
+  const candidates: ScanCandidate[] = [];
+  const languageSet = new Set<string>();
+  let skippedLargeFiles = 0;
+  let skippedByPattern = 0;
+  for (const absPath of absolutePaths) {
+    const relPath = relative(root, absPath);
+    // Check against ignore patterns
+    if (ig.ignores(relPath)) {
+      skippedByPattern++;
+      continue;
+    }
+    try {
+      // v1.9.5: Check file size before reading
+      const fileStat = statSync(absPath);
+      if (fileStat.size > maxFileSize) {
+        skippedLargeFiles++;
+        continue;
+      }
+      const content = readFileSync(absPath, 'utf-8');
+      const language = detectLanguage(absPath);
+      const loc = countLines(content);
+      // Find inference call candidates
+      const fileCandidates = findCandidatesInContent(relPath, content);
+      // v1.9.5: Only include files with candidates (unless includeAll)
+      if (includeAll || fileCandidates.length > 0) {
+        files.push({
+          path: relPath,
+          language,
+          loc,
+        });
+        languageSet.add(language);
+        candidates.push(...fileCandidates);
+      }
+    } catch {
+      // Skip files that can't be read
+    }
+  }
+  // Calculate summary
+  const totalLoc = files.reduce((sum, f) => sum + f.loc, 0);
+  return {
+    root,
+    files,
+    candidates,
+    summary: {
+      totalFiles: files.length,
+      totalLoc,
+      languages: Array.from(languageSet).sort(),
+      totalCandidates: candidates.length,
+      // v1.9.5: Cost optimization stats
+      skippedLargeFiles,
+      skippedByPattern,
+    },
+  };
+}