npm - @oculum/scanner - Versions diffs - 1.0.0 - Mend

@oculum/scanner 1.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (281) hide show

package/dist/formatters/cli-terminal.d.ts +27 -0
package/dist/formatters/cli-terminal.d.ts.map +1 -0
package/dist/formatters/cli-terminal.js +412 -0
package/dist/formatters/cli-terminal.js.map +1 -0
package/dist/formatters/github-comment.d.ts +41 -0
package/dist/formatters/github-comment.d.ts.map +1 -0
package/dist/formatters/github-comment.js +306 -0
package/dist/formatters/github-comment.js.map +1 -0
package/dist/formatters/grouping.d.ts +52 -0
package/dist/formatters/grouping.d.ts.map +1 -0
package/dist/formatters/grouping.js +152 -0
package/dist/formatters/grouping.js.map +1 -0
package/dist/formatters/index.d.ts +9 -0
package/dist/formatters/index.d.ts.map +1 -0
package/dist/formatters/index.js +35 -0
package/dist/formatters/index.js.map +1 -0
package/dist/formatters/vscode-diagnostic.d.ts +103 -0
package/dist/formatters/vscode-diagnostic.d.ts.map +1 -0
package/dist/formatters/vscode-diagnostic.js +151 -0
package/dist/formatters/vscode-diagnostic.js.map +1 -0
package/dist/index.d.ts +52 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +648 -0
package/dist/index.js.map +1 -0
package/dist/layer1/comments.d.ts +8 -0
package/dist/layer1/comments.d.ts.map +1 -0
package/dist/layer1/comments.js +203 -0
package/dist/layer1/comments.js.map +1 -0
package/dist/layer1/config-audit.d.ts +8 -0
package/dist/layer1/config-audit.d.ts.map +1 -0
package/dist/layer1/config-audit.js +252 -0
package/dist/layer1/config-audit.js.map +1 -0
package/dist/layer1/entropy.d.ts +8 -0
package/dist/layer1/entropy.d.ts.map +1 -0
package/dist/layer1/entropy.js +500 -0
package/dist/layer1/entropy.js.map +1 -0
package/dist/layer1/file-flags.d.ts +7 -0
package/dist/layer1/file-flags.d.ts.map +1 -0
package/dist/layer1/file-flags.js +112 -0
package/dist/layer1/file-flags.js.map +1 -0
package/dist/layer1/index.d.ts +36 -0
package/dist/layer1/index.d.ts.map +1 -0
package/dist/layer1/index.js +132 -0
package/dist/layer1/index.js.map +1 -0
package/dist/layer1/patterns.d.ts +8 -0
package/dist/layer1/patterns.d.ts.map +1 -0
package/dist/layer1/patterns.js +482 -0
package/dist/layer1/patterns.js.map +1 -0
package/dist/layer1/urls.d.ts +8 -0
package/dist/layer1/urls.d.ts.map +1 -0
package/dist/layer1/urls.js +296 -0
package/dist/layer1/urls.js.map +1 -0
package/dist/layer1/weak-crypto.d.ts +7 -0
package/dist/layer1/weak-crypto.d.ts.map +1 -0
package/dist/layer1/weak-crypto.js +291 -0
package/dist/layer1/weak-crypto.js.map +1 -0
package/dist/layer2/ai-agent-tools.d.ts +19 -0
package/dist/layer2/ai-agent-tools.d.ts.map +1 -0
package/dist/layer2/ai-agent-tools.js +528 -0
package/dist/layer2/ai-agent-tools.js.map +1 -0
package/dist/layer2/ai-endpoint-protection.d.ts +36 -0
package/dist/layer2/ai-endpoint-protection.d.ts.map +1 -0
package/dist/layer2/ai-endpoint-protection.js +332 -0
package/dist/layer2/ai-endpoint-protection.js.map +1 -0
package/dist/layer2/ai-execution-sinks.d.ts +18 -0
package/dist/layer2/ai-execution-sinks.d.ts.map +1 -0
package/dist/layer2/ai-execution-sinks.js +496 -0
package/dist/layer2/ai-execution-sinks.js.map +1 -0
package/dist/layer2/ai-fingerprinting.d.ts +7 -0
package/dist/layer2/ai-fingerprinting.d.ts.map +1 -0
package/dist/layer2/ai-fingerprinting.js +654 -0
package/dist/layer2/ai-fingerprinting.js.map +1 -0
package/dist/layer2/ai-prompt-hygiene.d.ts +19 -0
package/dist/layer2/ai-prompt-hygiene.d.ts.map +1 -0
package/dist/layer2/ai-prompt-hygiene.js +356 -0
package/dist/layer2/ai-prompt-hygiene.js.map +1 -0
package/dist/layer2/ai-rag-safety.d.ts +21 -0
package/dist/layer2/ai-rag-safety.d.ts.map +1 -0
package/dist/layer2/ai-rag-safety.js +459 -0
package/dist/layer2/ai-rag-safety.js.map +1 -0
package/dist/layer2/ai-schema-validation.d.ts +25 -0
package/dist/layer2/ai-schema-validation.d.ts.map +1 -0
package/dist/layer2/ai-schema-validation.js +375 -0
package/dist/layer2/ai-schema-validation.js.map +1 -0
package/dist/layer2/auth-antipatterns.d.ts +20 -0
package/dist/layer2/auth-antipatterns.d.ts.map +1 -0
package/dist/layer2/auth-antipatterns.js +333 -0
package/dist/layer2/auth-antipatterns.js.map +1 -0
package/dist/layer2/byok-patterns.d.ts +12 -0
package/dist/layer2/byok-patterns.d.ts.map +1 -0
package/dist/layer2/byok-patterns.js +299 -0
package/dist/layer2/byok-patterns.js.map +1 -0
package/dist/layer2/dangerous-functions.d.ts +7 -0
package/dist/layer2/dangerous-functions.d.ts.map +1 -0
package/dist/layer2/dangerous-functions.js +1375 -0
package/dist/layer2/dangerous-functions.js.map +1 -0
package/dist/layer2/data-exposure.d.ts +16 -0
package/dist/layer2/data-exposure.d.ts.map +1 -0
package/dist/layer2/data-exposure.js +279 -0
package/dist/layer2/data-exposure.js.map +1 -0
package/dist/layer2/framework-checks.d.ts +7 -0
package/dist/layer2/framework-checks.d.ts.map +1 -0
package/dist/layer2/framework-checks.js +388 -0
package/dist/layer2/framework-checks.js.map +1 -0
package/dist/layer2/index.d.ts +58 -0
package/dist/layer2/index.d.ts.map +1 -0
package/dist/layer2/index.js +380 -0
package/dist/layer2/index.js.map +1 -0
package/dist/layer2/logic-gates.d.ts +7 -0
package/dist/layer2/logic-gates.d.ts.map +1 -0
package/dist/layer2/logic-gates.js +182 -0
package/dist/layer2/logic-gates.js.map +1 -0
package/dist/layer2/risky-imports.d.ts +7 -0
package/dist/layer2/risky-imports.d.ts.map +1 -0
package/dist/layer2/risky-imports.js +161 -0
package/dist/layer2/risky-imports.js.map +1 -0
package/dist/layer2/variables.d.ts +8 -0
package/dist/layer2/variables.d.ts.map +1 -0
package/dist/layer2/variables.js +152 -0
package/dist/layer2/variables.js.map +1 -0
package/dist/layer3/anthropic.d.ts +83 -0
package/dist/layer3/anthropic.d.ts.map +1 -0
package/dist/layer3/anthropic.js +1745 -0
package/dist/layer3/anthropic.js.map +1 -0
package/dist/layer3/index.d.ts +24 -0
package/dist/layer3/index.d.ts.map +1 -0
package/dist/layer3/index.js +119 -0
package/dist/layer3/index.js.map +1 -0
package/dist/layer3/openai.d.ts +25 -0
package/dist/layer3/openai.d.ts.map +1 -0
package/dist/layer3/openai.js +238 -0
package/dist/layer3/openai.js.map +1 -0
package/dist/layer3/package-check.d.ts +63 -0
package/dist/layer3/package-check.d.ts.map +1 -0
package/dist/layer3/package-check.js +508 -0
package/dist/layer3/package-check.js.map +1 -0
package/dist/modes/incremental.d.ts +66 -0
package/dist/modes/incremental.d.ts.map +1 -0
package/dist/modes/incremental.js +200 -0
package/dist/modes/incremental.js.map +1 -0
package/dist/tiers.d.ts +125 -0
package/dist/tiers.d.ts.map +1 -0
package/dist/tiers.js +234 -0
package/dist/tiers.js.map +1 -0
package/dist/types.d.ts +175 -0
package/dist/types.d.ts.map +1 -0
package/dist/types.js +50 -0
package/dist/types.js.map +1 -0
package/dist/utils/auth-helper-detector.d.ts +56 -0
package/dist/utils/auth-helper-detector.d.ts.map +1 -0
package/dist/utils/auth-helper-detector.js +360 -0
package/dist/utils/auth-helper-detector.js.map +1 -0
package/dist/utils/context-helpers.d.ts +96 -0
package/dist/utils/context-helpers.d.ts.map +1 -0
package/dist/utils/context-helpers.js +493 -0
package/dist/utils/context-helpers.js.map +1 -0
package/dist/utils/diff-detector.d.ts +53 -0
package/dist/utils/diff-detector.d.ts.map +1 -0
package/dist/utils/diff-detector.js +104 -0
package/dist/utils/diff-detector.js.map +1 -0
package/dist/utils/diff-parser.d.ts +80 -0
package/dist/utils/diff-parser.d.ts.map +1 -0
package/dist/utils/diff-parser.js +202 -0
package/dist/utils/diff-parser.js.map +1 -0
package/dist/utils/imported-auth-detector.d.ts +37 -0
package/dist/utils/imported-auth-detector.d.ts.map +1 -0
package/dist/utils/imported-auth-detector.js +251 -0
package/dist/utils/imported-auth-detector.js.map +1 -0
package/dist/utils/middleware-detector.d.ts +55 -0
package/dist/utils/middleware-detector.d.ts.map +1 -0
package/dist/utils/middleware-detector.js +260 -0
package/dist/utils/middleware-detector.js.map +1 -0
package/dist/utils/oauth-flow-detector.d.ts +41 -0
package/dist/utils/oauth-flow-detector.d.ts.map +1 -0
package/dist/utils/oauth-flow-detector.js +202 -0
package/dist/utils/oauth-flow-detector.js.map +1 -0
package/dist/utils/path-exclusions.d.ts +55 -0
package/dist/utils/path-exclusions.d.ts.map +1 -0
package/dist/utils/path-exclusions.js +222 -0
package/dist/utils/path-exclusions.js.map +1 -0
package/dist/utils/project-context-builder.d.ts +119 -0
package/dist/utils/project-context-builder.d.ts.map +1 -0
package/dist/utils/project-context-builder.js +534 -0
package/dist/utils/project-context-builder.js.map +1 -0
package/dist/utils/registry-clients.d.ts +93 -0
package/dist/utils/registry-clients.d.ts.map +1 -0
package/dist/utils/registry-clients.js +273 -0
package/dist/utils/registry-clients.js.map +1 -0
package/dist/utils/trpc-analyzer.d.ts +78 -0
package/dist/utils/trpc-analyzer.d.ts.map +1 -0
package/dist/utils/trpc-analyzer.js +297 -0
package/dist/utils/trpc-analyzer.js.map +1 -0
package/package.json +45 -0
package/src/__tests__/benchmark/fixtures/false-positives.ts +227 -0
package/src/__tests__/benchmark/fixtures/index.ts +68 -0
package/src/__tests__/benchmark/fixtures/layer1/config-audit.ts +364 -0
package/src/__tests__/benchmark/fixtures/layer1/hardcoded-secrets.ts +173 -0
package/src/__tests__/benchmark/fixtures/layer1/high-entropy.ts +234 -0
package/src/__tests__/benchmark/fixtures/layer1/index.ts +31 -0
package/src/__tests__/benchmark/fixtures/layer1/sensitive-urls.ts +90 -0
package/src/__tests__/benchmark/fixtures/layer1/weak-crypto.ts +197 -0
package/src/__tests__/benchmark/fixtures/layer2/ai-agent-tools.ts +170 -0
package/src/__tests__/benchmark/fixtures/layer2/ai-endpoint-protection.ts +418 -0
package/src/__tests__/benchmark/fixtures/layer2/ai-execution-sinks.ts +189 -0
package/src/__tests__/benchmark/fixtures/layer2/ai-fingerprinting.ts +316 -0
package/src/__tests__/benchmark/fixtures/layer2/ai-prompt-hygiene.ts +178 -0
package/src/__tests__/benchmark/fixtures/layer2/ai-rag-safety.ts +184 -0
package/src/__tests__/benchmark/fixtures/layer2/ai-schema-validation.ts +434 -0
package/src/__tests__/benchmark/fixtures/layer2/auth-antipatterns.ts +159 -0
package/src/__tests__/benchmark/fixtures/layer2/byok-patterns.ts +112 -0
package/src/__tests__/benchmark/fixtures/layer2/dangerous-functions.ts +246 -0
package/src/__tests__/benchmark/fixtures/layer2/data-exposure.ts +168 -0
package/src/__tests__/benchmark/fixtures/layer2/framework-checks.ts +346 -0
package/src/__tests__/benchmark/fixtures/layer2/index.ts +67 -0
package/src/__tests__/benchmark/fixtures/layer2/injection-vulnerabilities.ts +239 -0
package/src/__tests__/benchmark/fixtures/layer2/logic-gates.ts +246 -0
package/src/__tests__/benchmark/fixtures/layer2/risky-imports.ts +231 -0
package/src/__tests__/benchmark/fixtures/layer2/variables.ts +167 -0
package/src/__tests__/benchmark/index.ts +29 -0
package/src/__tests__/benchmark/run-benchmark.ts +144 -0
package/src/__tests__/benchmark/run-depth-validation.ts +206 -0
package/src/__tests__/benchmark/run-real-world-test.ts +243 -0
package/src/__tests__/benchmark/security-benchmark-script.ts +1737 -0
package/src/__tests__/benchmark/tier-integration-script.ts +177 -0
package/src/__tests__/benchmark/types.ts +144 -0
package/src/__tests__/benchmark/utils/test-runner.ts +475 -0
package/src/__tests__/regression/known-false-positives.test.ts +467 -0
package/src/__tests__/snapshots/__snapshots__/scan-depth.test.ts.snap +178 -0
package/src/__tests__/snapshots/scan-depth.test.ts +258 -0
package/src/__tests__/validation/analyze-results.ts +542 -0
package/src/__tests__/validation/extract-for-triage.ts +146 -0
package/src/__tests__/validation/fp-deep-analysis.ts +327 -0
package/src/__tests__/validation/run-validation.ts +364 -0
package/src/__tests__/validation/triage-template.md +132 -0
package/src/formatters/cli-terminal.ts +446 -0
package/src/formatters/github-comment.ts +382 -0
package/src/formatters/grouping.ts +190 -0
package/src/formatters/index.ts +47 -0
package/src/formatters/vscode-diagnostic.ts +243 -0
package/src/index.ts +823 -0
package/src/layer1/comments.ts +218 -0
package/src/layer1/config-audit.ts +289 -0
package/src/layer1/entropy.ts +583 -0
package/src/layer1/file-flags.ts +127 -0
package/src/layer1/index.ts +181 -0
package/src/layer1/patterns.ts +516 -0
package/src/layer1/urls.ts +334 -0
package/src/layer1/weak-crypto.ts +328 -0
package/src/layer2/ai-agent-tools.ts +601 -0
package/src/layer2/ai-endpoint-protection.ts +387 -0
package/src/layer2/ai-execution-sinks.ts +580 -0
package/src/layer2/ai-fingerprinting.ts +758 -0
package/src/layer2/ai-prompt-hygiene.ts +411 -0
package/src/layer2/ai-rag-safety.ts +511 -0
package/src/layer2/ai-schema-validation.ts +421 -0
package/src/layer2/auth-antipatterns.ts +394 -0
package/src/layer2/byok-patterns.ts +336 -0
package/src/layer2/dangerous-functions.ts +1563 -0
package/src/layer2/data-exposure.ts +315 -0
package/src/layer2/framework-checks.ts +433 -0
package/src/layer2/index.ts +473 -0
package/src/layer2/logic-gates.ts +206 -0
package/src/layer2/risky-imports.ts +186 -0
package/src/layer2/variables.ts +166 -0
package/src/layer3/anthropic.ts +2030 -0
package/src/layer3/index.ts +130 -0
package/src/layer3/package-check.ts +604 -0
package/src/modes/incremental.ts +293 -0
package/src/tiers.ts +318 -0
package/src/types.ts +284 -0
package/src/utils/auth-helper-detector.ts +443 -0
package/src/utils/context-helpers.ts +535 -0
package/src/utils/diff-detector.ts +135 -0
package/src/utils/diff-parser.ts +272 -0
package/src/utils/imported-auth-detector.ts +320 -0
package/src/utils/middleware-detector.ts +333 -0
package/src/utils/oauth-flow-detector.ts +246 -0
package/src/utils/path-exclusions.ts +266 -0
package/src/utils/project-context-builder.ts +707 -0
package/src/utils/registry-clients.ts +351 -0
package/src/utils/trpc-analyzer.ts +382 -0

package/src/__tests__/validation/fp-deep-analysis.ts ADDED Viewed

@@ -0,0 +1,327 @@
+#!/usr/bin/env npx tsx
+/**
+ * M7 Deep FP Analysis
+ *
+ * Analyzes the gap between cheap and validated scans to identify
+ * exactly which patterns are causing false positives and where
+ * to focus tuning efforts.
+ */
+import * as fs from 'fs'
+import * as path from 'path'
+import type { ScanResult, Vulnerability } from '../../types'
+const RESULTS_DIR = path.join(__dirname, '../../../validation-results')
+const OUTPUT_PATH = path.join(__dirname, '../../../docs/FP_DEEP_ANALYSIS.md')
+interface RejectedFinding {
+  repo: string
+  file: string
+  line: number
+  category: string
+  title: string
+  severity: string
+  lineContent: string
+}
+interface CategoryAnalysis {
+  category: string
+  cheapCount: number
+  validatedCount: number
+  rejectedCount: number
+  fpRate: number
+  byPathType: Record<string, RejectedFinding[]>
+  byTitle: Record<string, number>
+  sampleFindings: RejectedFinding[]
+}
+function classifyPath(filePath: string): string {
+  const lower = filePath.toLowerCase()
+  if (lower.includes('/examples/') || lower.includes('/example/')) return 'examples'
+  if (lower.includes('/__tests__/') || lower.includes('/test/') || lower.includes('.test.') || lower.includes('.spec.')) return 'tests'
+  if (lower.includes('/src/') || lower.includes('/lib/') || lower.includes('/libs/')) return 'library'
+  return 'other'
+}
+function loadScanResult(fileName: string): ScanResult | null {
+  const filePath = path.join(RESULTS_DIR, fileName)
+  if (!fs.existsSync(filePath)) return null
+  return JSON.parse(fs.readFileSync(filePath, 'utf-8'))
+}
+function findRejectedFindings(cheapFile: string, validatedFile: string): RejectedFinding[] {
+  const cheap = loadScanResult(cheapFile)
+  const validated = loadScanResult(validatedFile)
+  if (!cheap || !validated) return []
+  // Build set of validated finding keys
+  const validatedKeys = new Set(
+    validated.vulnerabilities.map(v => `${v.filePath}:${v.lineNumber}:${v.category}`)
+  )
+  // Find what was rejected (in cheap but not in validated)
+  const rejected: RejectedFinding[] = []
+  for (const v of cheap.vulnerabilities) {
+    if (!['critical', 'high'].includes(v.severity)) continue
+    const key = `${v.filePath}:${v.lineNumber}:${v.category}`
+    if (!validatedKeys.has(key)) {
+      rejected.push({
+        repo: cheap.repoName,
+        file: v.filePath,
+        line: v.lineNumber,
+        category: v.category,
+        title: v.title,
+        severity: v.severity,
+        lineContent: v.lineContent?.slice(0, 100) || '',
+      })
+    }
+  }
+  return rejected
+}
+function analyzeCategory(category: string, findings: RejectedFinding[], cheapCount: number, validatedCount: number): CategoryAnalysis {
+  const byPathType: Record<string, RejectedFinding[]> = {}
+  const byTitle: Record<string, number> = {}
+  for (const f of findings) {
+    const pathType = classifyPath(f.file)
+    if (!byPathType[pathType]) byPathType[pathType] = []
+    byPathType[pathType].push(f)
+    byTitle[f.title] = (byTitle[f.title] || 0) + 1
+  }
+  return {
+    category,
+    cheapCount,
+    validatedCount,
+    rejectedCount: findings.length,
+    fpRate: cheapCount > 0 ? Math.round((findings.length / cheapCount) * 100) : 0,
+    byPathType,
+    byTitle,
+    sampleFindings: findings.slice(0, 10),
+  }
+}
+function generateMarkdown(analyses: CategoryAnalysis[]): string {
+  const lines: string[] = []
+  lines.push('# M7: False Positive Deep Analysis')
+  lines.push('')
+  lines.push('> This document analyzes exactly where the scanner is generating false positives')
+  lines.push('> to guide targeted improvements to the heuristics.')
+  lines.push('')
+  lines.push('## Executive Summary')
+  lines.push('')
+  lines.push('**Problem:** 69% of Critical+High findings in cheap scans are false positives that')
+  lines.push('require expensive AI validation to filter. We need to improve the heuristics to')
+  lines.push('reduce this noise at the source.')
+  lines.push('')
+  lines.push('## Category FP Rates (Critical+High only)')
+  lines.push('')
+  lines.push('| Category | Cheap | Validated | Rejected | FP Rate |')
+  lines.push('|----------|-------|-----------|----------|---------|')
+  for (const a of analyses.sort((a, b) => b.rejectedCount - a.rejectedCount)) {
+    lines.push(`| ${a.category} | ${a.cheapCount} | ${a.validatedCount} | ${a.rejectedCount} | **${a.fpRate}%** |`)
+  }
+  lines.push('')
+  lines.push('## Detailed Analysis by Category')
+  lines.push('')
+  for (const a of analyses.sort((a, b) => b.rejectedCount - a.rejectedCount)) {
+    if (a.rejectedCount === 0) continue
+    lines.push(`### ${a.category}`)
+    lines.push('')
+    lines.push(`- **FP Rate:** ${a.fpRate}% (${a.rejectedCount}/${a.cheapCount} rejected)`)
+    lines.push('')
+    // Path type breakdown
+    lines.push('**Where FPs occur:**')
+    lines.push('')
+    for (const [pathType, findings] of Object.entries(a.byPathType)) {
+      lines.push(`- ${pathType}: ${findings.length} findings (${Math.round((findings.length / a.rejectedCount) * 100)}%)`)
+    }
+    lines.push('')
+    // Title breakdown
+    const sortedTitles = Object.entries(a.byTitle).sort((a, b) => b[1] - a[1])
+    lines.push('**Common patterns:**')
+    lines.push('')
+    for (const [title, count] of sortedTitles.slice(0, 5)) {
+      lines.push(`- "${title}": ${count} occurrences`)
+    }
+    lines.push('')
+    // Sample findings
+    lines.push('**Sample rejected findings:**')
+    lines.push('')
+    lines.push('```')
+    for (const f of a.sampleFindings.slice(0, 5)) {
+      lines.push(`${f.file}:${f.line}`)
+      lines.push(`  Title: ${f.title}`)
+      lines.push(`  Code: ${f.lineContent}`)
+      lines.push('')
+    }
+    lines.push('```')
+    lines.push('')
+    // Recommendations
+    lines.push('**Tuning recommendations:**')
+    lines.push('')
+    // Category-specific recommendations
+    if (a.category === 'ai_endpoint_unprotected') {
+      const examplePct = a.byPathType['examples'] ? Math.round((a.byPathType['examples'].length / a.rejectedCount) * 100) : 0
+      if (examplePct > 50) {
+        lines.push(`- ${examplePct}% of FPs are in /examples/ directories. Add path-based severity downgrade.`)
+      }
+      lines.push('- Check for global middleware patterns more aggressively')
+      lines.push('- Recognize demo/tutorial context from surrounding code')
+    } else if (a.category === 'ai_overpermissive_tool') {
+      lines.push('- Distinguish between library definitions (intentionally flexible) and app usage')
+      lines.push('- Check if tools have sandboxing/restrictions defined elsewhere')
+      lines.push('- Look for permission checks in tool implementation')
+    } else if (a.category === 'ai_rag_exfiltration') {
+      const libPct = a.byPathType['library'] ? Math.round((a.byPathType['library'].length / a.rejectedCount) * 100) : 0
+      if (libPct > 50) {
+        lines.push(`- ${libPct}% of FPs are in library code. Library base classes are intentionally generic.`)
+        lines.push('- Downgrade library code to info severity (consumers add filters)')
+      }
+      lines.push('- Look for filter parameters in method signatures')
+    } else if (a.category === 'ai_unsafe_execution') {
+      const examplePct = a.byPathType['examples'] ? Math.round((a.byPathType['examples'].length / a.rejectedCount) * 100) : 0
+      lines.push('- Check if path comes from trusted source (config, not user input)')
+      if (examplePct > 30) {
+        lines.push(`- ${examplePct}% in examples - consider demo context`)
+      }
+    } else if (a.category === 'hardcoded_secret') {
+      lines.push('- These are likely test/fixture data - check file context')
+      lines.push('- Look for variable names containing "test", "mock", "example"')
+      lines.push('- Check entropy threshold - may be too sensitive')
+    }
+    lines.push('')
+  }
+  // Overall recommendations
+  lines.push('## Overall Recommendations')
+  lines.push('')
+  lines.push('### Quick Wins (High Impact, Low Effort)')
+  lines.push('')
+  lines.push('1. **Path-based severity adjustment:** Downgrade findings in `/examples/` directories to info')
+  lines.push('2. **Library code handling:** Flag library base classes as "intentionally generic" with lower severity')
+  lines.push('3. **Test file handling:** Already done, but verify it covers all patterns')
+  lines.push('')
+  lines.push('### Medium-Term Improvements')
+  lines.push('')
+  lines.push('1. **Better context detection:** Look at surrounding code for security indicators')
+  lines.push('2. **Cross-file analysis:** Check if protection exists in middleware/imports')
+  lines.push('3. **Comment analysis:** Look for "// example", "// demo", "// for testing" patterns')
+  lines.push('')
+  lines.push('### Cost Reduction Strategy')
+  lines.push('')
+  lines.push('If we can reduce the FP rate from 69% to 30% through heuristic improvements:')
+  lines.push('- AI validation calls would drop by ~57%')
+  lines.push('- $3 scan cost would become ~$1.30')
+  lines.push('- Better user experience (less noise to review)')
+  lines.push('')
+  return lines.join('\n')
+}
+async function main() {
+  console.log('Loading scan results...')
+  // Find rejected findings from all repos
+  const allRejected: RejectedFinding[] = [
+    ...findRejectedFindings('ai-cheap.json', 'ai-validated.json'),
+    ...findRejectedFindings('langchainjs-cheap.json', 'langchainjs-validated.json'),
+    ...findRejectedFindings('anthropic-cookbook-cheap.json', 'anthropic-cookbook-validated.json'),
+    ...findRejectedFindings('openai-cookbook-cheap.json', 'openai-cookbook-validated.json'),
+  ]
+  console.log(`Found ${allRejected.length} rejected findings (FPs)`)
+  // Load cheap scan totals by category
+  const cheapTotals: Record<string, number> = {}
+  const validatedTotals: Record<string, number> = {}
+  const cheapFiles = ['ai-cheap.json', 'langchainjs-cheap.json', 'anthropic-cookbook-cheap.json', 'openai-cookbook-cheap.json']
+  const validatedFiles = ['ai-validated.json', 'langchainjs-validated.json', 'anthropic-cookbook-validated.json', 'openai-cookbook-validated.json']
+  for (const f of cheapFiles) {
+    const result = loadScanResult(f)
+    if (!result) continue
+    for (const v of result.vulnerabilities) {
+      if (!['critical', 'high'].includes(v.severity)) continue
+      cheapTotals[v.category] = (cheapTotals[v.category] || 0) + 1
+    }
+  }
+  for (const f of validatedFiles) {
+    const result = loadScanResult(f)
+    if (!result) continue
+    for (const v of result.vulnerabilities) {
+      if (!['critical', 'high'].includes(v.severity)) continue
+      validatedTotals[v.category] = (validatedTotals[v.category] || 0) + 1
+    }
+  }
+  // Group rejected by category
+  const byCategory: Record<string, RejectedFinding[]> = {}
+  for (const f of allRejected) {
+    if (!byCategory[f.category]) byCategory[f.category] = []
+    byCategory[f.category].push(f)
+  }
+  // Analyze each category
+  const analyses: CategoryAnalysis[] = []
+  for (const [category, findings] of Object.entries(byCategory)) {
+    analyses.push(analyzeCategory(
+      category,
+      findings,
+      cheapTotals[category] || 0,
+      validatedTotals[category] || 0
+    ))
+  }
+  // Also add categories with 0% FP rate
+  for (const [category, count] of Object.entries(cheapTotals)) {
+    if (!byCategory[category]) {
+      analyses.push({
+        category,
+        cheapCount: count,
+        validatedCount: validatedTotals[category] || 0,
+        rejectedCount: 0,
+        fpRate: 0,
+        byPathType: {},
+        byTitle: {},
+        sampleFindings: [],
+      })
+    }
+  }
+  // Generate report
+  const markdown = generateMarkdown(analyses)
+  // Ensure output directory exists
+  const outputDir = path.dirname(OUTPUT_PATH)
+  if (!fs.existsSync(outputDir)) {
+    fs.mkdirSync(outputDir, { recursive: true })
+  }
+  fs.writeFileSync(OUTPUT_PATH, markdown)
+  console.log(`\nReport saved to: ${OUTPUT_PATH}`)
+  // Print summary
+  console.log('\n=== SUMMARY ===')
+  console.log('Categories with highest FP rates:')
+  for (const a of analyses.sort((a, b) => b.fpRate - a.fpRate).slice(0, 5)) {
+    if (a.cheapCount === 0) continue
+    console.log(`  ${a.category}: ${a.fpRate}% FP rate (${a.rejectedCount}/${a.cheapCount})`)
+  }
+}
+main().catch(console.error)

package/src/__tests__/validation/run-validation.ts ADDED Viewed

@@ -0,0 +1,364 @@
+#!/usr/bin/env npx tsx
+/**
+ * M7: Real-Repo Validation Script
+ *
+ * Runs security scans on real-world AI/LLM codebases to validate
+ * scanner effectiveness before beta launch.
+ *
+ * Target repos:
+ * - langchainjs (LangChain.js)
+ * - ai (Vercel AI SDK)
+ * - openai-cookbook
+ * - anthropic-cookbook
+ *
+ * Usage:
+ *   npx tsx packages/scanner/src/__tests__/validation/run-validation.ts
+ *   npx tsx packages/scanner/src/__tests__/validation/run-validation.ts --repo langchainjs
+ *   npx tsx packages/scanner/src/__tests__/validation/run-validation.ts --depth cheap
+ */
+import * as fs from 'fs'
+import * as path from 'path'
+import { glob } from 'glob'
+import { runScan, type ScanFile, type ScanResult, type ScanDepth } from '../../index'
+// Configuration
+const VALIDATION_DIR = path.join(__dirname, '../../../validation-repos')
+const RESULTS_DIR = path.join(__dirname, '../../../validation-results')
+const TARGET_REPOS = ['langchainjs', 'ai', 'openai-cookbook', 'anthropic-cookbook']
+const SCAN_DEPTHS: ScanDepth[] = ['cheap', 'validated']
+// File patterns to scan
+const INCLUDE_PATTERNS = [
+  '**/*.ts',
+  '**/*.tsx',
+  '**/*.js',
+  '**/*.jsx',
+  '**/*.py',
+  '**/*.json',
+  '**/*.yaml',
+  '**/*.yml',
+]
+// Patterns to exclude
+const EXCLUDE_PATTERNS = [
+  '**/node_modules/**',
+  '**/dist/**',
+  '**/build/**',
+  '**/.git/**',
+  '**/coverage/**',
+  '**/__pycache__/**',
+  '**/venv/**',
+  '**/.venv/**',
+  '**/vendor/**',
+  '**/*.min.js',
+  '**/*.bundle.js',
+  '**/package-lock.json',
+  '**/yarn.lock',
+  '**/pnpm-lock.yaml',
+]
+// Max file size (50KB as per scanner spec)
+const MAX_FILE_SIZE = 50 * 1024
+interface ValidationConfig {
+  repos: string[]
+  depths: ScanDepth[]
+  maxFilesPerRepo?: number
+  verbose: boolean
+}
+/**
+ * Collect scannable files from a repository
+ */
+async function collectFiles(repoPath: string, maxFiles?: number): Promise<ScanFile[]> {
+  const files: ScanFile[] = []
+  for (const pattern of INCLUDE_PATTERNS) {
+    const matches = await glob(pattern, {
+      cwd: repoPath,
+      ignore: EXCLUDE_PATTERNS,
+      nodir: true,
+      absolute: false,
+    })
+    for (const match of matches) {
+      if (maxFiles && files.length >= maxFiles) break
+      const filePath = path.join(repoPath, match)
+      try {
+        const stats = fs.statSync(filePath)
+        if (stats.size > MAX_FILE_SIZE) continue
+        const content = fs.readFileSync(filePath, 'utf-8')
+        const ext = path.extname(match).slice(1)
+        files.push({
+          path: match,
+          content,
+          language: getLanguage(ext),
+          size: stats.size,
+        })
+      } catch (err) {
+        // Skip files that can't be read
+        continue
+      }
+    }
+    if (maxFiles && files.length >= maxFiles) break
+  }
+  return files
+}
+/**
+ * Map file extension to language
+ */
+function getLanguage(ext: string): string {
+  const langMap: Record<string, string> = {
+    ts: 'typescript',
+    tsx: 'typescript',
+    js: 'javascript',
+    jsx: 'javascript',
+    py: 'python',
+    json: 'json',
+    yaml: 'yaml',
+    yml: 'yaml',
+  }
+  return langMap[ext] || ext
+}
+/**
+ * Run a scan on a repository
+ */
+async function scanRepo(
+  repoName: string,
+  depth: ScanDepth,
+  verbose: boolean,
+  maxFiles?: number
+): Promise<ScanResult> {
+  const repoPath = path.join(VALIDATION_DIR, repoName)
+  if (!fs.existsSync(repoPath)) {
+    throw new Error(`Repository not found: ${repoPath}. Run: git clone --depth 1 https://github.com/<org>/${repoName}.git ${repoPath}`)
+  }
+  console.log(`\n${'='.repeat(60)}`)
+  console.log(`Scanning: ${repoName} (depth: ${depth})`)
+  console.log('='.repeat(60))
+  // Collect files
+  const startCollect = Date.now()
+  const files = await collectFiles(repoPath, maxFiles)
+  const collectTime = Date.now() - startCollect
+  console.log(`Collected ${files.length} files in ${collectTime}ms`)
+  if (files.length === 0) {
+    throw new Error(`No scannable files found in ${repoPath}`)
+  }
+  // Run scan
+  const result = await runScan(
+    files,
+    {
+      name: repoName,
+      url: `https://github.com/${getRepoOrg(repoName)}/${repoName}`,
+      branch: 'main',
+    },
+    {
+      enableAI: depth !== 'cheap', // Only enable AI for validated/deep
+      scanDepth: depth,
+    },
+    verbose ? (progress) => {
+      console.log(`  [${progress.status}] ${progress.message}`)
+    } : undefined
+  )
+  // Print summary
+  console.log(`\nScan complete in ${result.scanDuration}ms`)
+  console.log(`  Files scanned: ${result.filesScanned}`)
+  console.log(`  Total findings: ${result.vulnerabilities.length}`)
+  console.log(`  Severity breakdown:`)
+  console.log(`    Critical: ${result.severityCounts.critical}`)
+  console.log(`    High:     ${result.severityCounts.high}`)
+  console.log(`    Medium:   ${result.severityCounts.medium}`)
+  console.log(`    Low:      ${result.severityCounts.low}`)
+  console.log(`    Info:     ${result.severityCounts.info}`)
+  return result
+}
+/**
+ * Get GitHub organization for a repo
+ */
+function getRepoOrg(repoName: string): string {
+  const orgs: Record<string, string> = {
+    langchainjs: 'langchain-ai',
+    ai: 'vercel',
+    'openai-cookbook': 'openai',
+    'anthropic-cookbook': 'anthropics',
+  }
+  return orgs[repoName] || 'unknown'
+}
+/**
+ * Save scan results to file
+ */
+function saveResults(repoName: string, depth: ScanDepth, result: ScanResult): string {
+  const outputPath = path.join(RESULTS_DIR, `${repoName}-${depth}.json`)
+  // Ensure results directory exists
+  if (!fs.existsSync(RESULTS_DIR)) {
+    fs.mkdirSync(RESULTS_DIR, { recursive: true })
+  }
+  fs.writeFileSync(outputPath, JSON.stringify(result, null, 2))
+  console.log(`Results saved to: ${outputPath}`)
+  return outputPath
+}
+/**
+ * Parse command line arguments
+ */
+function parseArgs(): ValidationConfig {
+  const args = process.argv.slice(2)
+  const config: ValidationConfig = {
+    repos: TARGET_REPOS,
+    depths: SCAN_DEPTHS,
+    verbose: false,
+  }
+  for (let i = 0; i < args.length; i++) {
+    const arg = args[i]
+    if (arg === '--repo' && args[i + 1]) {
+      const repo = args[i + 1]
+      if (!TARGET_REPOS.includes(repo)) {
+        console.error(`Unknown repo: ${repo}. Valid repos: ${TARGET_REPOS.join(', ')}`)
+        process.exit(1)
+      }
+      config.repos = [repo]
+      i++
+    } else if (arg === '--depth' && args[i + 1]) {
+      const depth = args[i + 1] as ScanDepth
+      if (!['cheap', 'validated', 'deep'].includes(depth)) {
+        console.error(`Invalid depth: ${depth}. Valid depths: cheap, validated, deep`)
+        process.exit(1)
+      }
+      config.depths = [depth]
+      i++
+    } else if (arg === '--max-files' && args[i + 1]) {
+      config.maxFilesPerRepo = parseInt(args[i + 1], 10)
+      i++
+    } else if (arg === '--verbose' || arg === '-v') {
+      config.verbose = true
+    } else if (arg === '--help' || arg === '-h') {
+      console.log(`
+M7: Real-Repo Validation Script
+Usage:
+  npx tsx run-validation.ts [options]
+Options:
+  --repo <name>       Scan only this repo (langchainjs, ai, openai-cookbook, anthropic-cookbook)
+  --depth <depth>     Use only this scan depth (cheap, validated, deep)
+  --max-files <n>     Limit files per repo (for faster testing)
+  --verbose, -v       Show detailed progress
+  --help, -h          Show this help
+Examples:
+  npx tsx run-validation.ts                           # Scan all repos at all depths
+  npx tsx run-validation.ts --repo langchainjs        # Scan only LangChain.js
+  npx tsx run-validation.ts --depth cheap             # Only cheap scans
+  npx tsx run-validation.ts --repo ai --max-files 50  # Quick test on Vercel AI SDK
+`)
+      process.exit(0)
+    }
+  }
+  return config
+}
+/**
+ * Main entry point
+ */
+async function main() {
+  const config = parseArgs()
+  const results: Map<string, ScanResult> = new Map()
+  console.log('\n' + '='.repeat(60))
+  console.log('M7: REAL-REPO VALIDATION')
+  console.log('='.repeat(60))
+  console.log(`Repos: ${config.repos.join(', ')}`)
+  console.log(`Depths: ${config.depths.join(', ')}`)
+  if (config.maxFilesPerRepo) {
+    console.log(`Max files per repo: ${config.maxFilesPerRepo}`)
+  }
+  // Check repos exist
+  for (const repo of config.repos) {
+    const repoPath = path.join(VALIDATION_DIR, repo)
+    if (!fs.existsSync(repoPath)) {
+      console.error(`\nError: Repository not found: ${repoPath}`)
+      console.error(`Please clone it first:`)
+      console.error(`  cd ${VALIDATION_DIR}`)
+      console.error(`  git clone --depth 1 https://github.com/${getRepoOrg(repo)}/${repo}.git`)
+      process.exit(1)
+    }
+  }
+  // Run scans
+  const totalScans = config.repos.length * config.depths.length
+  let scanCount = 0
+  for (const repo of config.repos) {
+    for (const depth of config.depths) {
+      scanCount++
+      console.log(`\n[${scanCount}/${totalScans}] Starting scan...`)
+      try {
+        const result = await scanRepo(repo, depth, config.verbose, config.maxFilesPerRepo)
+        const key = `${repo}-${depth}`
+        results.set(key, result)
+        saveResults(repo, depth, result)
+      } catch (err) {
+        console.error(`Error scanning ${repo} at ${depth}:`, err)
+      }
+    }
+  }
+  // Print summary
+  console.log('\n' + '='.repeat(60))
+  console.log('VALIDATION SUMMARY')
+  console.log('='.repeat(60))
+  for (const [key, result] of results) {
+    const [repo, depth] = key.split('-')
+    const mediumPlus = result.severityCounts.critical +
+                       result.severityCounts.high +
+                       result.severityCounts.medium
+    console.log(`\n${repo} (${depth}):`)
+    console.log(`  Files: ${result.filesScanned}`)
+    console.log(`  Total findings: ${result.vulnerabilities.length}`)
+    console.log(`  Medium+ findings: ${mediumPlus} (to triage)`)
+    console.log(`  Duration: ${result.scanDuration}ms`)
+  }
+  console.log('\n' + '='.repeat(60))
+  console.log('Next steps:')
+  console.log('1. Run analyze-results.ts to generate detailed metrics')
+  console.log('2. Review medium+ findings for FP triage')
+  console.log('3. Update docs/RESULTSCOMPARISON.md with findings')
+  console.log('='.repeat(60))
+}
+// Run
+main().catch(err => {
+  console.error('Validation failed:', err)
+  process.exit(1)
+})