npm - @clear-capabilities/agentic-security-scanner - Versions diffs - 0.74.0 - Mend

@clear-capabilities/agentic-security-scanner 0.74.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (331) hide show

package/CHANGELOG.md +1580 -0
package/bin/.agentic-security/findings.json +1577 -0
package/bin/.agentic-security/last-scan.json +1577 -0
package/bin/.agentic-security/last-scan.json.sig +1 -0
package/bin/.agentic-security/scan-history.json +465 -0
package/bin/.agentic-security/streak.json +25 -0
package/bin/agentic-security-audit.js +198 -0
package/bin/agentic-security-consistency.js +80 -0
package/bin/agentic-security-diff.js +136 -0
package/bin/agentic-security-lsp.js +12 -0
package/bin/agentic-security-mcp.js +40 -0
package/bin/agentic-security-rule.js +153 -0
package/bin/agentic-security.js +1683 -0
package/dist/117.index.js +207 -0
package/dist/178.index.js +250 -0
package/dist/218.index.js +793 -0
package/dist/227.index.js +192 -0
package/dist/301.index.js +167 -0
package/dist/384.index.js +18 -0
package/dist/476.index.js +126 -0
package/dist/513.index.js +373 -0
package/dist/520.index.js +13 -0
package/dist/601.index.js +1038 -0
package/dist/634.index.js +1892 -0
package/dist/637.index.js +216 -0
package/dist/660.index.js +131 -0
package/dist/675.index.js +451 -0
package/dist/826.index.js +188 -0
package/dist/830.index.js +133 -0
package/dist/agentic-security.mjs +272 -0
package/dist/agentic-security.mjs.sha256 +1 -0
package/dist/calibration-seed.json +27 -0
package/package.json +77 -0
package/src/.agentic-security/findings.json +80844 -0
package/src/.agentic-security/last-scan.json +80844 -0
package/src/.agentic-security/last-scan.json.sig +1 -0
package/src/.agentic-security/scan-history.json +8408 -0
package/src/.agentic-security/streak.json +26 -0
package/src/badge.js +188 -0
package/src/compare.js +203 -0
package/src/dataflow/.agentic-security/findings.json +3487 -0
package/src/dataflow/.agentic-security/last-scan.json +3487 -0
package/src/dataflow/.agentic-security/last-scan.json.sig +1 -0
package/src/dataflow/.agentic-security/scan-history.json +735 -0
package/src/dataflow/.agentic-security/streak.json +24 -0
package/src/dataflow/CLAUDE.md +38 -0
package/src/dataflow/access-paths.js +172 -0
package/src/dataflow/async-sequencing.js +177 -0
package/src/dataflow/backward.js +201 -0
package/src/dataflow/catalog-expanded.js +485 -0
package/src/dataflow/catalog.js +659 -0
package/src/dataflow/cross-repo.js +219 -0
package/src/dataflow/engine.js +588 -0
package/src/dataflow/exception-flow.js +116 -0
package/src/dataflow/exploit-prover.js +187 -0
package/src/dataflow/higher-order.js +221 -0
package/src/dataflow/ifds.js +347 -0
package/src/dataflow/implicit-flow.js +129 -0
package/src/dataflow/incremental.js +229 -0
package/src/dataflow/index.js +181 -0
package/src/dataflow/numeric-domain.js +192 -0
package/src/dataflow/path-feasibility.js +114 -0
package/src/dataflow/points-to.js +337 -0
package/src/dataflow/polyglot.js +190 -0
package/src/dataflow/proven-clean.js +159 -0
package/src/dataflow/receiver-context.js +76 -0
package/src/dataflow/sanitizer-proof.js +154 -0
package/src/dataflow/soft-taint.js +140 -0
package/src/dataflow/string-domain.js +234 -0
package/src/dataflow/stub-aware-filter.js +100 -0
package/src/dataflow/summaries.js +132 -0
package/src/dataflow/symbolic-exec.js +238 -0
package/src/dataflow/tabulation.js +135 -0
package/src/engine.js +7763 -0
package/src/history-scan.js +229 -0
package/src/index.js +3 -0
package/src/integrations/.agentic-security/findings.json +1504 -0
package/src/integrations/.agentic-security/last-scan.json +1504 -0
package/src/integrations/.agentic-security/scan-history.json +40 -0
package/src/integrations/.agentic-security/streak.json +21 -0
package/src/integrations/index.js +321 -0
package/src/integrations/tickets.js +200 -0
package/src/ir/.agentic-security/findings.json +3036 -0
package/src/ir/.agentic-security/last-scan.json +3036 -0
package/src/ir/.agentic-security/last-scan.json.sig +1 -0
package/src/ir/.agentic-security/scan-history.json +364 -0
package/src/ir/.agentic-security/streak.json +23 -0
package/src/ir/CLAUDE.md +172 -0
package/src/ir/callgraph.js +73 -0
package/src/ir/class-hierarchy.js +195 -0
package/src/ir/index.js +152 -0
package/src/ir/parser-cs.js +260 -0
package/src/ir/parser-java.js +286 -0
package/src/ir/parser-js.js +413 -0
package/src/ir/parser-kt.js +258 -0
package/src/ir/parser-py-cst.js +136 -0
package/src/ir/parser-py.helper.py +501 -0
package/src/ir/parser-py.js +312 -0
package/src/ir/ssa.js +315 -0
package/src/ir/type-stubs.js +288 -0
package/src/leaderboard.js +152 -0
package/src/llm-validator/.agentic-security/findings.json +1891 -0
package/src/llm-validator/.agentic-security/last-scan.json +1891 -0
package/src/llm-validator/.agentic-security/last-scan.json.sig +1 -0
package/src/llm-validator/.agentic-security/scan-history.json +168 -0
package/src/llm-validator/.agentic-security/streak.json +20 -0
package/src/llm-validator/consistency.js +141 -0
package/src/llm-validator/index.js +437 -0
package/src/lsp/.agentic-security/findings.json +28 -0
package/src/lsp/.agentic-security/last-scan.json +28 -0
package/src/lsp/.agentic-security/scan-history.json +79 -0
package/src/lsp/.agentic-security/streak.json +22 -0
package/src/lsp/server.js +275 -0
package/src/mcp/.agentic-security/findings.json +8358 -0
package/src/mcp/.agentic-security/last-scan.json +8358 -0
package/src/mcp/.agentic-security/last-scan.json.sig +1 -0
package/src/mcp/.agentic-security/scan-history.json +1125 -0
package/src/mcp/.agentic-security/streak.json +22 -0
package/src/mcp/CLAUDE.md +54 -0
package/src/mcp/audit.js +136 -0
package/src/mcp/redact.js +75 -0
package/src/mcp/server.js +158 -0
package/src/mcp/stdio.js +83 -0
package/src/mcp/tools.js +940 -0
package/src/mcp/validate.js +49 -0
package/src/personality.js +164 -0
package/src/poc-video.js +239 -0
package/src/posture/.agentic-security/findings.json +51239 -0
package/src/posture/.agentic-security/last-scan.json +51239 -0
package/src/posture/.agentic-security/last-scan.json.sig +1 -0
package/src/posture/.agentic-security/scan-history.json +5557 -0
package/src/posture/.agentic-security/streak.json +24 -0
package/src/posture/CLAUDE.md +42 -0
package/src/posture/adversarial-self-test.js +114 -0
package/src/posture/adversary-agent.js +204 -0
package/src/posture/agents-memory.js +135 -0
package/src/posture/ai-code-fingerprint.js +171 -0
package/src/posture/aibom.js +284 -0
package/src/posture/api-inventory.js +96 -0
package/src/posture/attack-playbooks.js +305 -0
package/src/posture/auditor-agent.js +115 -0
package/src/posture/auth-posture-import.js +135 -0
package/src/posture/baseline-compare.js +114 -0
package/src/posture/blast-radius.js +836 -0
package/src/posture/bounty-prediction.js +141 -0
package/src/posture/business-logic.js +239 -0
package/src/posture/calibration-drift.js +93 -0
package/src/posture/calibration-seed.json +27 -0
package/src/posture/calibration.js +204 -0
package/src/posture/clustering.js +75 -0
package/src/posture/concurrency-checker.js +265 -0
package/src/posture/confidence.js +65 -0
package/src/posture/container-runtime.js +149 -0
package/src/posture/counterfactual.js +109 -0
package/src/posture/cross-lang-graphql.js +165 -0
package/src/posture/cross-lang-grpc.js +166 -0
package/src/posture/cross-lang-meta.js +101 -0
package/src/posture/cross-lang-openapi.js +187 -0
package/src/posture/cross-lang-orm.js +153 -0
package/src/posture/cross-lang-queues.js +210 -0
package/src/posture/crown-jewels.js +110 -0
package/src/posture/custom-rules.js +361 -0
package/src/posture/cve-alert-daemon.js +433 -0
package/src/posture/cve-lookup.js +129 -0
package/src/posture/dead-code.js +430 -0
package/src/posture/defender-agent.js +158 -0
package/src/posture/deploy-platform.js +204 -0
package/src/posture/detector-fuzz.js +61 -0
package/src/posture/deterministic.js +99 -0
package/src/posture/drift.js +165 -0
package/src/posture/epss.js +156 -0
package/src/posture/exploitability-probability.js +212 -0
package/src/posture/exploitability.js +121 -0
package/src/posture/feature-flags.js +110 -0
package/src/posture/finding-defaults.js +132 -0
package/src/posture/fix-history.js +411 -0
package/src/posture/fix-plan.js +121 -0
package/src/posture/fix-verify-loop.js +157 -0
package/src/posture/fix-verify.js +130 -0
package/src/posture/flow-narration.js +105 -0
package/src/posture/grader-calibration.js +156 -0
package/src/posture/harness-discovery.js +113 -0
package/src/posture/holdout-eval.js +144 -0
package/src/posture/iac-reachability.js +163 -0
package/src/posture/iam-policy.js +128 -0
package/src/posture/integrity.js +97 -0
package/src/posture/learning.js +166 -0
package/src/posture/license-policy.js +109 -0
package/src/posture/llm-redteam-prompts.js +418 -0
package/src/posture/llm-redteam.js +303 -0
package/src/posture/material-change.js +163 -0
package/src/posture/mitigation-composite.js +55 -0
package/src/posture/mttr.js +91 -0
package/src/posture/network-policy-import.js +126 -0
package/src/posture/path-predicates.js +99 -0
package/src/posture/persona-prioritization.js +153 -0
package/src/posture/poc-cwe-map.js +51 -0
package/src/posture/poc-generator.js +500 -0
package/src/posture/policy-gate.js +174 -0
package/src/posture/pre-incident-archaeology.js +110 -0
package/src/posture/profile.js +93 -0
package/src/posture/reachability-filter.js +42 -0
package/src/posture/regression-test-gen.js +200 -0
package/src/posture/reverse-blast-radius.js +110 -0
package/src/posture/router.js +109 -0
package/src/posture/rule-overrides.js +198 -0
package/src/posture/rule-pack-signing.js +209 -0
package/src/posture/rule-packs.js +143 -0
package/src/posture/rule-synthesis.js +108 -0
package/src/posture/ruleset-version.js +71 -0
package/src/posture/sbom.js +129 -0
package/src/posture/schema-aware-bridge.js +207 -0
package/src/posture/security-trend.js +87 -0
package/src/posture/semantic-clone.js +114 -0
package/src/posture/specification-mining.js +170 -0
package/src/posture/stable-id.js +75 -0
package/src/posture/stack-playbook.js +229 -0
package/src/posture/streak.js +249 -0
package/src/posture/suppressions.js +135 -0
package/src/posture/telemetry-ingest.js +112 -0
package/src/posture/threat-model.js +145 -0
package/src/posture/three-agent-pipeline.js +74 -0
package/src/posture/triage.js +146 -0
package/src/posture/trust-boundary-diagram.js +115 -0
package/src/posture/type-narrowing.js +129 -0
package/src/posture/validator-metrics.js +179 -0
package/src/posture/verifier-ephemeral.js +118 -0
package/src/posture/verifier-target.js +147 -0
package/src/posture/verifier.js +257 -0
package/src/posture/version.js +75 -0
package/src/posture/waf-ingest.js +200 -0
package/src/posture/why-fired.js +141 -0
package/src/pr-comment.js +172 -0
package/src/pr-delta.js +198 -0
package/src/report/.agentic-security/findings.json +79 -0
package/src/report/.agentic-security/last-scan.json +79 -0
package/src/report/.agentic-security/last-scan.json.sig +1 -0
package/src/report/.agentic-security/scan-history.json +332 -0
package/src/report/.agentic-security/streak.json +23 -0
package/src/report/index.js +1136 -0
package/src/report/mascot.js +42 -0
package/src/runScan.js +141 -0
package/src/sast/.agentic-security/findings.json +5051 -0
package/src/sast/.agentic-security/last-scan.json +5051 -0
package/src/sast/.agentic-security/last-scan.json.sig +1 -0
package/src/sast/.agentic-security/scan-history.json +788 -0
package/src/sast/.agentic-security/streak.json +23 -0
package/src/sast/CLAUDE.md +39 -0
package/src/sast/_comment-strip.js +46 -0
package/src/sast/agent-tool-escalation.js +131 -0
package/src/sast/auth-provider.js +171 -0
package/src/sast/authz.js +236 -0
package/src/sast/bench-shape/.agentic-security/findings.json +28 -0
package/src/sast/bench-shape/.agentic-security/last-scan.json +28 -0
package/src/sast/bench-shape/.agentic-security/scan-history.json +24 -0
package/src/sast/bench-shape/.agentic-security/streak.json +22 -0
package/src/sast/bench-shape/index.js +62 -0
package/src/sast/claude-hook-injection.js +199 -0
package/src/sast/claude-md-prompt-injection.js +170 -0
package/src/sast/claude-settings.js +165 -0
package/src/sast/client-side.js +149 -0
package/src/sast/cpp-bench-extras.js +122 -0
package/src/sast/cpp-dataflow.js +430 -0
package/src/sast/cpp.js +248 -0
package/src/sast/csharp.js +152 -0
package/src/sast/csrf.js +82 -0
package/src/sast/dart-flutter.js +173 -0
package/src/sast/db-rls.js +147 -0
package/src/sast/db-taint.js +215 -0
package/src/sast/defi-deep.js +242 -0
package/src/sast/deserialization-gadgets.js +113 -0
package/src/sast/django-hardening.js +230 -0
package/src/sast/env-hygiene.js +125 -0
package/src/sast/fastapi-hardening.js +145 -0
package/src/sast/go-extended.js +84 -0
package/src/sast/host-header.js +106 -0
package/src/sast/index.js +17 -0
package/src/sast/java-ast-folding.js +561 -0
package/src/sast/java-bench-extras.js +708 -0
package/src/sast/java-collection-passthrough.js +178 -0
package/src/sast/java-constant-fold.js +244 -0
package/src/sast/java-deserialization.js +125 -0
package/src/sast/jndi.js +104 -0
package/src/sast/juliet-shape.js +324 -0
package/src/sast/jwt-exp.js +104 -0
package/src/sast/kotlin.js +82 -0
package/src/sast/laravel-hardening.js +198 -0
package/src/sast/ldap-injection.js +100 -0
package/src/sast/llm-owasp.js +465 -0
package/src/sast/llm-stored-prompt.js +103 -0
package/src/sast/llm-trading-agent.js +161 -0
package/src/sast/llm.js +308 -0
package/src/sast/logic.js +140 -0
package/src/sast/mass-assignment.js +101 -0
package/src/sast/mcp-audit.js +242 -0
package/src/sast/mobile-manifest.js +195 -0
package/src/sast/model-load.js +164 -0
package/src/sast/mutation-xss.js +87 -0
package/src/sast/nosql-injection.js +82 -0
package/src/sast/open-redirect.js +119 -0
package/src/sast/php.js +91 -0
package/src/sast/pipeline.js +122 -0
package/src/sast/primary-cwe-java.js +155 -0
package/src/sast/prompt-firewall.js +151 -0
package/src/sast/prompt-template.js +157 -0
package/src/sast/prototype-pollution.js +112 -0
package/src/sast/python-sinks.js +195 -0
package/src/sast/quarkus-hardening.js +102 -0
package/src/sast/rag-poisoning.js +118 -0
package/src/sast/rate-limit.js +128 -0
package/src/sast/response-splitting.js +138 -0
package/src/sast/ruby.js +108 -0
package/src/sast/rust.js +105 -0
package/src/sast/solidity.js +167 -0
package/src/sast/springboot-hardening.js +186 -0
package/src/sast/ssrf-cloud-metadata.js +80 -0
package/src/sast/ssti.js +116 -0
package/src/sast/swift.js +162 -0
package/src/sast/toctou.js +95 -0
package/src/sast/webhook.js +101 -0
package/src/sast/xpath-injection.js +51 -0
package/src/sast/xxe.js +140 -0
package/src/sast/zip-slip.js +200 -0
package/src/sca/base-images.json +45 -0
package/src/sca/container.js +107 -0
package/src/sca/dep-confusion.js +134 -0
package/src/sca/index.js +6 -0
package/src/sca/popular-packages.json +41 -0
package/src/sca/sarif-ingest.js +187 -0
package/src/sca/vuln-function-hints.json +89 -0
package/src/secrets/index.js +4 -0

package/src/sast/python-sinks.js ADDED Viewed

@@ -0,0 +1,195 @@
+// Python sink-side SAST (FR-PY-SAST — Phase-2 G3 blocker).
+//
+// The polyglot benchmark in v0.50.0 showed Python detector coverage is the
+// single largest blocker behind the polyglot F1 gap (target 0.85, today 0.727).
+// This module fills the most-common Python sink shapes:
+//
+//   - SQLAlchemy text() with f-string concat → SQL injection
+//   - os.system / subprocess with shell=True or string concat → command injection
+//   - pickle.loads / yaml.load on request data → insecure deserialization
+//   - eval / exec on request data → code injection
+//   - flask.send_file / send_from_directory with user-controlled path → path traversal
+//   - requests with verify=False → insecure HTTPS
+//
+// Limits:
+//   - Regex-based, no Python AST today (tree-sitter integration is Phase 5).
+//   - "User-controlled" is shape-matched, not flow-traced (any `request.`
+//     reference in the same call site qualifies). This is conservative —
+//     we'll miss flows that route through helpers, and we'll false-positive
+//     when `request.` is unrelated to the sink. Calibration is the answer
+//     (FR-LEARN-5), not pre-filtering.
+import { blankComments } from './_comment-strip.js';
+const PY_EXT_RE = /\.py$/i;
+function lineOf(raw, idx) { return raw.substring(0, idx).split('\n').length; }
+// ─── SQLAlchemy text() with f-string ──────────────────────────────────────
+//
+// `engine.execute(text(f"SELECT ... {var}"))`
+// `connection.execute(text(f"..."))`
+// The dangerous shape is text() wrapping an f-string. Parameterized queries
+// use `text("... :name").bindparams(name=...)` — the f-string variant
+// indicates concat.
+const SQLA_TEXT_FSTRING_RE = /\btext\s*\(\s*f['"][^'"]*\{[^}]+\}/g;
+const SQLA_RAW_EXEC_CONCAT_RE = /\b(?:cursor|conn|connection|session)\s*\.\s*execute\s*\(\s*(?:f['"][^'"]*\{|['"][^'"]*['"]\s*[+%])/g;
+// A common shape: build the SQL in a previous line as an f-string, then pass
+// the variable to text() / execute(). We detect the f-string with SQL keywords
+// AND a `{...}` interpolation directly. The f-string body can contain inner
+// quotes (single quotes inside double-quoted f-string and vice versa) so we
+// use two parallel patterns rather than a single character class that excludes
+// both quote kinds.
+const SQLA_FSTRING_SQL_ASSIGN_RE = /(?:f"[^"]*(?:SELECT|INSERT|UPDATE|DELETE)[^"]*\{[^}]*\}|f'[^']*(?:SELECT|INSERT|UPDATE|DELETE)[^']*\{[^}]*\})/gi;
+// ─── Command injection ────────────────────────────────────────────────────
+//
+// `os.system(...)` with anything other than a literal
+// `subprocess.run(...,  shell=True)`
+// `subprocess.Popen(..., shell=True)`
+// `subprocess.call(..., shell=True)`
+// os.system is dangerous when the argument is anything but a pure quoted
+// literal. We use a negative lookahead for the "pure literal" shape:
+// `os.system("literal text")` is safe; everything else gets flagged.
+const PY_OS_SYSTEM_RE = /\bos\s*\.\s*system\s*\((?!\s*['"][^'"]*['"]\s*\))/g;
+const PY_SUBPROCESS_SHELL_TRUE_RE = /\bsubprocess\s*\.\s*(?:run|Popen|call|check_call|check_output)\s*\([^)]*shell\s*=\s*True/g;
+const PY_SHELL_EXEC_CONCAT_RE = /\bos\s*\.\s*(?:popen|exec[lv]p?)\s*\(/g;
+// ─── Insecure deserialization ─────────────────────────────────────────────
+const PY_PICKLE_LOADS_RE = /\bpickle\s*\.\s*loads?\s*\(/g;
+const PY_YAML_UNSAFE_LOAD_RE = /\byaml\s*\.\s*(?:unsafe_load|load)\s*\((?![^)]*Loader\s*=\s*(?:yaml\.SafeLoader|SafeLoader))/g;
+const PY_MARSHAL_LOADS_RE = /\bmarshal\s*\.\s*loads?\s*\(/g;
+// ─── Code injection ───────────────────────────────────────────────────────
+const PY_EVAL_USER_RE = /\b(?:eval|exec)\s*\(\s*[^)]*(?:request\.|flask\.request|input\s*\(|sys\.argv|os\.environ)/g;
+const PY_COMPILE_USER_RE = /\bcompile\s*\([^)]*(?:request\.|input\s*\(|sys\.argv)/g;
+// ─── Path traversal ───────────────────────────────────────────────────────
+//
+// `flask.send_file(user_path)` — known sink when path comes from request.
+// `flask.send_from_directory(dir, user_filename)` — same.
+// `open(user_path)` — generic file read with user input.
+// send_file with anything other than a pure literal path is dangerous.
+const PY_SEND_FILE_RE = /\b(?:flask\.)?send_file\s*\(\s*(?!['"][^'"]+['"]\s*\))/gi;
+const PY_SEND_FROM_DIR_RE = /\b(?:flask\.)?send_from_directory\s*\([^)]*,\s*(?:request\.|[a-zA-Z_]\w*)\s*[,)]/g;
+const PY_OPEN_USER_RE = /\bopen\s*\(\s*(?:request\.|f['"][^'"]*\{[^}]+\})/g;
+// ─── Insecure transport ───────────────────────────────────────────────────
+const PY_REQUESTS_VERIFY_FALSE_RE = /\brequests\s*\.\s*(?:get|post|put|delete|patch|head|request)\s*\([^)]*verify\s*=\s*False/g;
+const PY_URLLIB_NOCHECK_RE = /\bssl\s*\.\s*_create_unverified_context\s*\(/g;
+// ─── SSRF ─────────────────────────────────────────────────────────────────
+const PY_REQUESTS_USER_URL_RE = /\brequests\s*\.\s*(?:get|post|put|delete|patch|head|request)\s*\(\s*(?:request\.|f['"][^'"]*\{[^}]+\})/g;
+const PY_URLLIB_USER_URL_RE = /\b(?:urllib\.request\.urlopen|urlopen)\s*\(\s*(?:request\.|f['"][^'"]*\{[^}]+\})/g;
+// ─── XXE ──────────────────────────────────────────────────────────────────
+const PY_XML_INSECURE_RE = /\blxml\.etree\.(?:parse|fromstring)\s*\([^)]*\)(?!\s*[^.]*\bresolve_entities\s*=\s*False)/g;
+const PY_XML_ETREE_USER_RE = /\bxml\.etree\.ElementTree\.(?:parse|fromstring)\s*\(\s*(?:request\.|f['"][^'"]*\{)/g;
+// ─── Detector ─────────────────────────────────────────────────────────────
+const RULES = [
+  // Each rule: { re, vuln, severity, cwe, family, parser }
+  { re: SQLA_TEXT_FSTRING_RE,        vuln: 'SQL Injection (SQLAlchemy text() with f-string)',     severity: 'critical', cwe: 'CWE-89',  family: 'sql-injection' },
+  { re: SQLA_RAW_EXEC_CONCAT_RE,     vuln: 'SQL Injection (cursor.execute with concat)',          severity: 'critical', cwe: 'CWE-89',  family: 'sql-injection' },
+  { re: SQLA_FSTRING_SQL_ASSIGN_RE,  vuln: 'SQL Injection (f-string SQL assigned to variable)',   severity: 'high',     cwe: 'CWE-89',  family: 'sql-injection' },
+  { re: PY_OS_SYSTEM_RE,             vuln: 'Command Injection (os.system with variable arg)',     severity: 'critical', cwe: 'CWE-78',  family: 'command-injection' },
+  { re: PY_SUBPROCESS_SHELL_TRUE_RE, vuln: 'Command Injection (subprocess shell=True)',           severity: 'critical', cwe: 'CWE-78',  family: 'command-injection' },
+  { re: PY_SHELL_EXEC_CONCAT_RE,     vuln: 'Command Injection (os.popen / os.execlp)',            severity: 'high',     cwe: 'CWE-78',  family: 'command-injection' },
+  { re: PY_PICKLE_LOADS_RE,          vuln: 'Insecure Deserialization (pickle.loads on untrusted)', severity: 'critical', cwe: 'CWE-502', family: 'insecure-deserialization' },
+  { re: PY_YAML_UNSAFE_LOAD_RE,      vuln: 'Insecure Deserialization (yaml.load without SafeLoader)', severity: 'critical', cwe: 'CWE-502', family: 'insecure-deserialization' },
+  { re: PY_MARSHAL_LOADS_RE,         vuln: 'Insecure Deserialization (marshal.loads)',            severity: 'high',     cwe: 'CWE-502', family: 'insecure-deserialization' },
+  { re: PY_EVAL_USER_RE,             vuln: 'Code Injection (eval/exec on request data)',          severity: 'critical', cwe: 'CWE-94',  family: 'code-injection' },
+  { re: PY_COMPILE_USER_RE,          vuln: 'Code Injection (compile() on user input)',            severity: 'high',     cwe: 'CWE-94',  family: 'code-injection' },
+  { re: PY_SEND_FILE_RE,             vuln: 'Path Traversal (flask.send_file with user-controlled path)', severity: 'high', cwe: 'CWE-22', family: 'path-traversal' },
+  { re: PY_SEND_FROM_DIR_RE,         vuln: 'Path Traversal (flask.send_from_directory)',          severity: 'high',     cwe: 'CWE-22',  family: 'path-traversal' },
+  { re: PY_OPEN_USER_RE,             vuln: 'Path Traversal (open with user-controlled path)',     severity: 'high',     cwe: 'CWE-22',  family: 'path-traversal' },
+  { re: PY_REQUESTS_VERIFY_FALSE_RE, vuln: 'Insecure HTTPS (requests verify=False)',              severity: 'medium',   cwe: 'CWE-295', family: 'insecure-http' },
+  { re: PY_URLLIB_NOCHECK_RE,        vuln: 'Insecure HTTPS (ssl._create_unverified_context)',     severity: 'medium',   cwe: 'CWE-295', family: 'insecure-http' },
+  { re: PY_REQUESTS_USER_URL_RE,     vuln: 'SSRF (requests with user-controlled URL)',            severity: 'high',     cwe: 'CWE-918', family: 'ssrf' },
+  { re: PY_URLLIB_USER_URL_RE,       vuln: 'SSRF (urlopen with user-controlled URL)',             severity: 'high',     cwe: 'CWE-918', family: 'ssrf' },
+  { re: PY_XML_INSECURE_RE,          vuln: 'XXE (lxml without resolve_entities=False)',           severity: 'high',     cwe: 'CWE-611', family: 'xxe' },
+  { re: PY_XML_ETREE_USER_RE,        vuln: 'XXE (xml.etree.ElementTree on user input)',           severity: 'high',     cwe: 'CWE-611', family: 'xxe' },
+];
+export function scanPythonSinks(fp, raw) {
+  if (!PY_EXT_RE.test(fp)) return [];
+  if (!raw || raw.length > 500_000) return [];
+  // Skip test files — Python projects use `test_*.py` / `*_test.py` / `tests/`.
+  if (/(?:^|\/)(?:tests?|test_|_test\.py$)/i.test(fp) && !/fixtures?/i.test(fp)) return [];
+  const code = blankComments(raw, 'py');
+  const findings = [];
+  const seen = new Set();
+  for (const rule of RULES) {
+    const re = new RegExp(rule.re.source, rule.re.flags);
+    let m;
+    while ((m = re.exec(code))) {
+      const line = lineOf(raw, m.index);
+      const id = `${rule.family}:${fp}:${line}:${rule.cwe}`;
+      if (seen.has(id)) continue;
+      seen.add(id);
+      findings.push({
+        id,
+        file: fp,
+        line,
+        vuln: rule.vuln,
+        severity: rule.severity,
+        cwe: rule.cwe,
+        family: rule.family,
+        stride: _strideForFamily(rule.family),
+        snippet: (raw.split('\n')[line - 1] || '').trim().slice(0, 200),
+        parser: 'PY-SAST',
+        confidence: 0.7,
+        remediation: _remediationFor(rule.family, rule.vuln),
+      });
+    }
+  }
+  return findings;
+}
+function _strideForFamily(fam) {
+  return {
+    'sql-injection':            'Tampering',
+    'command-injection':        'Elevation of Privilege',
+    'insecure-deserialization': 'Elevation of Privilege',
+    'code-injection':           'Elevation of Privilege',
+    'path-traversal':           'Information Disclosure',
+    'insecure-http':            'Information Disclosure',
+    'ssrf':                     'Spoofing',
+    'xxe':                      'Information Disclosure',
+  }[fam] || 'Tampering';
+}
+function _remediationFor(fam, vuln) {
+  switch (fam) {
+    case 'sql-injection':
+      return 'Use parameterized queries: `connection.execute(text("SELECT ... WHERE id = :id"), {"id": id})` instead of f-string concat. For raw `cursor.execute`, pass the value as the second positional argument; never concatenate.';
+    case 'command-injection':
+      return 'Avoid `os.system` and `shell=True`. Use `subprocess.run([\'binary\', arg1, arg2], check=True)` with arguments as a list — the shell never sees the values, so shell metacharacters cannot be injected.';
+    case 'insecure-deserialization':
+      return 'Never `pickle.loads` untrusted bytes. Use `json.loads` for structured data. For YAML, use `yaml.safe_load`. For `marshal`, switch to JSON or a schema-validated alternative.';
+    case 'code-injection':
+      return 'Replace `eval` / `exec` with a safe parser appropriate to the input class — `ast.literal_eval` for Python literals, `json.loads` for JSON, a domain-specific parser for everything else.';
+    case 'path-traversal':
+      return 'Validate the user path is inside the intended directory: `os.path.realpath(os.path.join(base, user_path)).startswith(os.path.realpath(base))`. For `flask.send_from_directory`, ensure the filename is a known allowlisted value.';
+    case 'insecure-http':
+      return 'Remove `verify=False`. If you genuinely need to disable TLS verification for a known internal endpoint, scope it to that endpoint and document why; never broadly across `requests` calls.';
+    case 'ssrf':
+      return 'Validate the URL against an allowlist before fetching. Block private IP ranges (127.0.0.0/8, 10.0.0.0/8, 172.16.0.0/12, 192.168.0.0/16, 169.254.169.254 / metadata IPs).';
+    case 'xxe':
+      return 'Configure the XML parser to disable external entities: lxml `etree.XMLParser(resolve_entities=False, no_network=True)`; defusedxml is the safest drop-in.';
+    default:
+      return `Address the ${vuln} finding above.`;
+  }
+}
+// For tests + the no-dead-modules check.
+export const _ruleCount = RULES.length;

package/src/sast/quarkus-hardening.js ADDED Viewed

@@ -0,0 +1,102 @@
+// Quarkus framework hardening.
+//
+// Coverage:
+//   1. Resource methods exposed without @Authenticated / @RolesAllowed
+//   2. application.properties: quarkus.oidc.credentials.secret literal
+//   3. quarkus.security.users.embedded.* enabled in non-dev profile
+//   4. quarkus.http.cors=true with overly broad origins
+//   5. @PermitAll on /api/admin or similar sensitive paths
+//   6. mp.jwt.verify.publickey.location missing when @Authenticated present
+const _JAVA_RE = /\.java$/i;
+const _PROPS_RE = /(?:^|[\\/])application(?:[-.][\w-]+)?\.(?:properties|ya?ml)$/i;
+function _line(raw, idx) {
+  return raw.slice(0, idx).split('\n').length;
+}
+function _isQuarkusJava(raw) {
+  return /\bio\.quarkus\b|\bjakarta\.ws\.rs\b|\borg\.eclipse\.microprofile\b/.test(raw);
+}
+export function scanQuarkusHardening(file, raw) {
+  if (!file || !raw || typeof raw !== 'string') return [];
+  if (raw.length > 200_000) return [];
+  const findings = [];
+  // Properties file checks.
+  if (_PROPS_RE.test(file) && /\bquarkus\./.test(raw)) {
+    // OIDC client secret literal
+    for (const m of raw.matchAll(/^\s*quarkus\.oidc\.credentials\.secret\s*=\s*(\S+)/gmi)) {
+      const val = m[1].trim();
+      if (val.startsWith('${') || val === '' || val === '""' || val === "''") continue;
+      findings.push({
+        id: `quarkus:oidc-secret-literal:${file}:${_line(raw, m.index)}`,
+        file, line: _line(raw, m.index),
+        vuln: 'Quarkus OIDC client secret in plaintext config',
+        severity: 'critical',
+        family: 'quarkus-hardcoded-credential',
+        cwe: 'CWE-798',
+        confidence: 0.95,
+        description: 'quarkus.oidc.credentials.secret in source-controlled config lets anyone with repo read impersonate the application against the IdP.',
+        remediation: 'Replace with ${OIDC_CLIENT_SECRET} env-var reference and rotate the leaked secret.',
+      });
+    }
+    // Embedded user with literal password
+    for (const m of raw.matchAll(/^\s*quarkus\.security\.users\.embedded\.users\.\w+\s*=\s*(\S+)/gmi)) {
+      const val = m[1].trim();
+      if (val.startsWith('${')) continue;
+      findings.push({
+        id: `quarkus:embedded-user-password:${file}:${_line(raw, m.index)}`,
+        file, line: _line(raw, m.index),
+        vuln: 'Quarkus embedded user with literal password (likely dev convenience leaked to prod)',
+        severity: 'critical',
+        family: 'quarkus-hardcoded-credential',
+        cwe: 'CWE-798',
+        confidence: 0.9,
+        description: 'Quarkus embedded identity is convenient for dev / smoke tests; pushing it to a non-dev profile creates a backdoor.',
+        remediation: 'Move the user/password to a real IdentityProvider (Keycloak, LDAP, DB). Quarkus dev-mode users should never ship to production.',
+      });
+    }
+    // Wildcard CORS origin
+    for (const m of raw.matchAll(/^\s*quarkus\.http\.cors\.origins\s*=\s*['"]?\*['"]?/gm)) {
+      findings.push({
+        id: `quarkus:cors-wildcard:${file}:${_line(raw, m.index)}`,
+        file, line: _line(raw, m.index),
+        vuln: 'Quarkus CORS origins = * (wildcard)',
+        severity: 'high',
+        family: 'quarkus-cors-wildcard',
+        cwe: 'CWE-942',
+        confidence: 0.9,
+        description: 'Wildcard CORS combined with credentialed requests allows any origin to read authenticated responses.',
+        remediation: 'Set quarkus.http.cors.origins=https://app.example.com (explicit list).',
+      });
+    }
+    return findings;
+  }
+  if (!_JAVA_RE.test(file)) return findings;
+  if (!_isQuarkusJava(raw)) return findings;
+  // Mutating JAX-RS endpoint without @Authenticated / @RolesAllowed / @PermitAll
+  const verbRe = /@(?:POST|PUT|PATCH|DELETE)\b[\s\S]{0,300}?public\s+\w[\w<>,\s\[\]?]*\s+(\w+)\s*\(/g;
+  let mm;
+  while ((mm = verbRe.exec(raw))) {
+    const lineIdx = _line(raw, mm.index);
+    const above = raw.slice(Math.max(0, mm.index - 400), mm.index);
+    if (/@(?:Authenticated|RolesAllowed|PermitAll|DenyAll)\b/.test(above)) continue;
+    findings.push({
+      id: `quarkus:no-authz:${file}:${lineIdx}:${mm[1]}`,
+      file, line: lineIdx,
+      vuln: `Quarkus mutating endpoint ${mm[1]}() has no @Authenticated / @RolesAllowed annotation`,
+      severity: 'high',
+      family: 'quarkus-missing-authz',
+      cwe: 'CWE-862',
+      confidence: 0.7,
+      description: 'A POST/PUT/PATCH/DELETE handler is exposed without authentication / authorization. Unless the path is gated by a wider mechanism, this endpoint is callable by anyone reaching it.',
+      remediation: 'Add @Authenticated on the resource class (default to require auth) and @RolesAllowed("admin") on privileged methods. Use @PermitAll explicitly when a method is truly public.',
+    });
+  }
+  return findings;
+}

package/src/sast/rag-poisoning.js ADDED Viewed

@@ -0,0 +1,118 @@
+// RAG Context-Poisoning Path (OWASP LLM02 — Training-Data Poisoning,
+// applied at retrieval-time rather than fine-tune time).
+//
+// Pattern: untrusted text from a user (req.body, file upload, web scrape,
+// external API) is written into a vector store / retrieval index without
+// (a) source attribution, (b) trust-level tagging, or (c) downstream
+// retrieval-side filtering. At LLM query time, the poisoned chunk is
+// retrieved with no signal that it shouldn't be trusted, and its
+// embedded instructions ride along into the model's context.
+//
+// We catch the WRITE side, not the READ — the retrieval side is too
+// generic to flag without taint context. The write-side signature is
+// strong: `<vector_store>.add(text=<user_input>)` with no metadata
+// indicating provenance / trust level.
+//
+// Vector-store libraries covered (v1):
+//   - chromadb (Python):  collection.add(documents=[...])
+//   - pinecone (Python/JS): index.upsert(vectors=[{values, metadata}])
+//   - weaviate:           client.collections.<n>.data.insert(...)
+//   - qdrant:             client.upsert(collection_name, points=[...])
+//   - langchain:          vectorstore.add_documents(...)
+//   - pgvector:           INSERT INTO embeddings (vec, content) VALUES (...)
+//
+// Suppress when:
+//   - the call includes `metadata: { source, trust_level, … }` and the
+//     trust_level is a non-trivial argument (not just '"trusted"')
+//   - a known sanitizer or denylist filter is referenced in the preceding
+//     30 lines
+import { blankComments } from './_comment-strip.js';
+const TAINT_HINT_RE =
+  /\b(?:req\.|request\.|params\.|query\.|body\.|ctx\.query|ctx\.request|reply\.query|c\.Query|r\.URL\.Query|_GET|_POST|_REQUEST|getParameter|getHeader|webhook|scrape|fetch\s*\()/;
+const PATTERNS = [
+  // chromadb collection.add
+  ['py', /\b(?:collection|chroma_collection)\s*\.\s*add\s*\(\s*documents\s*=\s*([^)]+?)\s*[,)]/g, 'ChromaDB'],
+  // langchain add_documents / add_texts
+  ['py', /\bvectorstore\s*\.\s*add_(?:documents|texts)\s*\(\s*([^)]+?)\s*[,)]/g, 'LangChain'],
+  ['js', /\bvectorStore\s*\.\s*add(?:Documents|Texts)\s*\(\s*([^)]+?)\s*[,)]/g, 'LangChain.js'],
+  // pinecone upsert
+  ['py', /\bindex\s*\.\s*upsert\s*\(\s*vectors\s*=\s*([^)]+?)\s*[,)]/g, 'Pinecone'],
+  ['js', /\bindex\s*\.\s*upsert\s*\(\s*([^)]+?)\s*\)/g, 'Pinecone'],
+  // weaviate insert
+  ['py', /\.\s*data\s*\.\s*insert\s*\(\s*([^)]+?)\s*[,)]/g, 'Weaviate'],
+  // qdrant upsert
+  ['py', /\bclient\s*\.\s*upsert\s*\(\s*collection_name[^,]+,\s*points\s*=\s*([^)]+?)\s*[,)]/g, 'Qdrant'],
+  // pgvector via raw INSERT
+  ['py', /\bINSERT\s+INTO\s+\w*embedding[^;]*VALUES\s*\(\s*([^)]+?)\)/gi, 'pgvector raw INSERT'],
+];
+const PROVENANCE_HINT_RE =
+  /\bmetadatas?\s*[=:]\s*\[?\s*\{[^}]*(?:source|trust_level|provenance|tenant_id|user_id|origin)/i;
+const SANITIZER_HINT_RE =
+  /\b(?:bleach\s*\.\s*clean|DOMPurify\.sanitize|stripUntrustedInstructions|detect_prompt_injection|denylist[A-Za-z0-9_]*|trustLevelOf)\b/;
+function _lineOf(raw, idx) { return raw.substring(0, idx).split('\n').length; }
+function _lang(fp) {
+  if (/\.(?:js|jsx|ts|tsx|mjs|cjs)$/i.test(fp)) return 'js';
+  if (/\.py$/i.test(fp)) return 'py';
+  return null;
+}
+function _hasSanitizerAbove(raw, line) {
+  const lines = raw.split('\n');
+  const lo = Math.max(0, line - 30);
+  return SANITIZER_HINT_RE.test(lines.slice(lo, line).join('\n'));
+}
+export function scanRAGPoisoning(fp, raw) {
+  if (!raw || raw.length > 500_000) return [];
+  const lang = _lang(fp);
+  if (!lang) return [];
+  const code = blankComments(raw, lang === 'py' ? 'py' : undefined);
+  if (!/\b(?:chromadb|chroma|pinecone|weaviate|qdrant|pgvector|langchain|vectorstore|vectorStore|embedding)\b/i.test(code)) return [];
+  const findings = [];
+  const seen = new Set();
+  for (const [plang, pat, label] of PATTERNS) {
+    if (plang !== lang) continue;
+    const re = new RegExp(pat.source, pat.flags);
+    let m;
+    while ((m = re.exec(code))) {
+      const callArgs = (m[1] || '');
+      if (!TAINT_HINT_RE.test(callArgs)) continue;
+      // The full call may extend beyond the captured fragment; look at the
+      // rest of the line block to check for provenance metadata.
+      const lineNo = _lineOf(raw, m.index);
+      const lines = raw.split('\n');
+      const blockEnd = Math.min(lines.length, lineNo + 5);
+      const block = lines.slice(lineNo - 1, blockEnd).join('\n');
+      if (PROVENANCE_HINT_RE.test(block)) continue;
+      if (_hasSanitizerAbove(raw, lineNo)) continue;
+      const id = `rag-poisoning:${fp}:${lineNo}:${label}`;
+      if (seen.has(id)) continue;
+      seen.add(id);
+      findings.push({
+        id,
+        file: fp, line: lineNo,
+        vuln: `RAG Context-Poisoning Path (${label})`,
+        severity: 'high',
+        cwe: 'CWE-1336',
+        family: 'rag-poisoning',
+        stride: 'Tampering',
+        snippet: (lines[lineNo - 1] || '').trim().slice(0, 200),
+        remediation:
+          'Untrusted user content is being written to a retrieval index without a provenance/trust-level tag. At retrieval time the chunk will appear in LLM context with no signal it shouldn\'t be trusted, and any embedded instructions ride along. ' +
+          'Mitigations: ' +
+          '(1) tag every write with `metadata: { source, trust_level, tenant_id }` and FILTER on `trust_level` at retrieval time; ' +
+          '(2) keep user-generated content in a separate index from curated/admin content and never mix them in the same retrieval; ' +
+          '(3) at retrieval time, wrap user-tier chunks in rare-token delimiters and instruct the model to treat them as data, not instructions; ' +
+          '(4) reject content that contains known prompt-injection sentinels ("ignore previous instructions", role-frame strings, etc.) before insertion.',
+        parser: 'RAG-POISONING',
+        confidence: 0.75,
+      });
+    }
+  }
+  return findings;
+}

package/src/sast/rate-limit.js ADDED Viewed

@@ -0,0 +1,128 @@
+// Rate limiting & abuse prevention advisor.
+//
+// Vibecoders forget rate limiting on auth, AI, payment, and form endpoints.
+// The consequence is account brute-force, $10k+ AI API bills from a single
+// attacker, and credential-stuffing. This module detects handler files that
+// define sensitive-category routes without a recognisable rate-limit guard.
+//
+// Findings:
+//   RATE_LIMIT_AUTH      — auth endpoint (login/register/forgot) without rate limiting
+//   RATE_LIMIT_AI        — AI generation endpoint without rate limiting
+//   RATE_LIMIT_PAYMENT   — payment / checkout endpoint without rate limiting
+//   RATE_LIMIT_CONTACT   — contact / submit form endpoint without rate limiting
+//   RATE_LIMIT_MISSING   — generic API endpoint without rate limiting when no RL lib imported
+const _SCAN_EXT_RE = /\.(?:js|jsx|ts|tsx|mjs|cjs)$/i;
+const _NONPROD_RE = /(?:^|\/)(?:tests?|__tests__|spec|fixtures?|examples?|node_modules)\//i;
+// Rate-limit library imports / usage signals
+const RL_IMPORT_RE = /(?:from|require)\s*\(?\s*['"`](?:express-rate-limit|rate-limiter-flexible|@upstash\/ratelimit|hono-rate-limiter|next-rate-limit|bottleneck|p-throttle|@nestjs\/throttler|fastify-rate-limit|koa-ratelimit|slowDown|express-slow-down)['"`]/i;
+const RL_USAGE_RE = /\b(?:rateLimit|rateLimiter|limiter|throttle|throttler|createRateLimiter|upstashRatelimit|slidingWindow|fixedWindow|tokenBucket)\s*\(/;
+const REDIS_RL_RE = /\b(?:incr|expire|setex)\s*\([^)]*(?:rate|limit|attempt|count)/i;
+// Route definition patterns
+const ROUTE_DEF_RE = /(?:app|router|server|Route)\s*\.\s*(?:get|post|put|patch|delete|all)\s*\(\s*['"`]([^'"`]+)['"`]/g;
+const NEXT_HANDLER_RE = /export\s+(?:default\s+)?(?:async\s+)?function\s+(?:POST|GET|PUT|PATCH|DELETE|handler)\b/;
+const NEXT_ROUTE_FILE_RE = /(?:^|\/)(?:app|pages)\/(?:api\/)?([^/]+(?:\/[^/]+)*)\//;
+// Sensitive endpoint categories by URL segment
+const AUTH_PATH_RE = /\/(?:auth|login|logout|signin|signout|signup|register|forgot|reset|password|verify|otp|mfa|2fa|token|refresh)\b/i;
+const AI_PATH_RE = /\/(?:ai|chat|generate|complete|completion|embed|embedding|gpt|claude|llm|openai|anthropic|inference|predict)\b/i;
+const PAYMENT_PATH_RE = /\/(?:pay(?:ment)?|checkout|stripe|order|subscribe|billing|invoice|charge|purchase)\b/i;
+const CONTACT_PATH_RE = /\/(?:contact|submit|feedback|form|newsletter|subscribe|waitlist|signup|onboard)\b/i;
+function _hasRateLimit(content) {
+  return RL_IMPORT_RE.test(content) || RL_USAGE_RE.test(content) || REDIS_RL_RE.test(content);
+}
+function _categorise(path) {
+  if (AUTH_PATH_RE.test(path)) return 'auth';
+  if (AI_PATH_RE.test(path)) return 'ai';
+  if (PAYMENT_PATH_RE.test(path)) return 'payment';
+  if (CONTACT_PATH_RE.test(path)) return 'contact';
+  return null;
+}
+const CATEGORY_META = {
+  auth: {
+    severity: 'high',
+    title: 'Auth endpoint missing rate limiting',
+    description: 'Authentication endpoints without rate limiting are trivially brute-forced. An attacker can try thousands of passwords per second at zero cost.',
+    remediation: 'Add a rate limiter: max 5 attempts per IP per 15 minutes on login/register. Use express-rate-limit, @upstash/ratelimit, or your platform\'s edge middleware.',
+    cwe: 'CWE-307',
+  },
+  ai: {
+    severity: 'high',
+    title: 'AI generation endpoint missing rate limiting',
+    description: 'AI API call endpoints without rate limiting let a single attacker exhaust your entire monthly OpenAI/Anthropic budget in minutes. This is a direct financial attack vector.',
+    remediation: 'Add per-user and per-IP rate limits on AI endpoints. Use @upstash/ratelimit for serverless or express-rate-limit for Node servers. Consider per-request cost caps as well.',
+    cwe: 'CWE-400',
+  },
+  payment: {
+    severity: 'high',
+    title: 'Payment endpoint missing rate limiting',
+    description: 'Payment and checkout endpoints without rate limiting enable card-testing attacks where attackers enumerate stolen card numbers at high speed.',
+    remediation: 'Add strict rate limiting (max 3 attempts per IP per hour) on payment endpoints. Stripe also recommends enabling Radar rules in the dashboard.',
+    cwe: 'CWE-307',
+  },
+  contact: {
+    severity: 'medium',
+    title: 'Contact / form endpoint missing rate limiting',
+    description: 'Unprotected form submission endpoints are used for spam campaigns, email flooding, and enumeration of valid email addresses.',
+    remediation: 'Add rate limiting (max 3 submissions per IP per hour) and consider adding a honeypot field or CAPTCHA for public-facing forms.',
+    cwe: 'CWE-400',
+  },
+};
+function scanRateLimit(file, content) {
+  if (!_SCAN_EXT_RE.test(file)) return [];
+  if (_NONPROD_RE.test(file)) return [];
+  if (_hasRateLimit(content)) return [];
+  const findings = [];
+  const lines = content.split('\n');
+  // Check named route definitions
+  let m;
+  ROUTE_DEF_RE.lastIndex = 0;
+  while ((m = ROUTE_DEF_RE.exec(content)) !== null) {
+    const routePath = m[1];
+    const cat = _categorise(routePath);
+    if (cat) {
+      const lineNum = content.slice(0, m.index).split('\n').length;
+      const meta = CATEGORY_META[cat];
+      findings.push({
+        id: `rate-limit:RATE_LIMIT_${cat.toUpperCase()}:${file}:${lineNum}`,
+        title: meta.title,
+        severity: meta.severity,
+        file, line: lineNum,
+        description: meta.description,
+        remediation: meta.remediation,
+        cwe: meta.cwe,
+      });
+    }
+  }
+  // Next.js route handler: infer category from file path
+  if (findings.length === 0 && NEXT_HANDLER_RE.test(content)) {
+    const filePathMatch = NEXT_ROUTE_FILE_RE.exec(file);
+    const routeSegment = filePathMatch ? '/' + filePathMatch[1] : file;
+    const cat = _categorise(routeSegment) || _categorise(file);
+    if (cat) {
+      const handlerLine = lines.findIndex(l => NEXT_HANDLER_RE.test(l)) + 1;
+      const meta = CATEGORY_META[cat];
+      findings.push({
+        id: `rate-limit:RATE_LIMIT_${cat.toUpperCase()}:${file}:${handlerLine}`,
+        title: meta.title,
+        severity: meta.severity,
+        file, line: handlerLine,
+        description: meta.description,
+        remediation: meta.remediation,
+        cwe: meta.cwe,
+      });
+    }
+  }
+  return findings;
+}
+export { scanRateLimit };