PyPI - devguard - Versions diffs - 0.2.0__py3-none-any.whl - Mend

devguard 0.2.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (60) hide show

devguard/INTEGRATION_SUMMARY.md +121 -0
devguard/__init__.py +3 -0
devguard/__main__.py +6 -0
devguard/checkers/__init__.py +41 -0
devguard/checkers/api_usage.py +523 -0
devguard/checkers/aws_cost.py +331 -0
devguard/checkers/aws_iam.py +284 -0
devguard/checkers/base.py +25 -0
devguard/checkers/container.py +137 -0
devguard/checkers/domain.py +189 -0
devguard/checkers/firecrawl.py +117 -0
devguard/checkers/fly.py +225 -0
devguard/checkers/github.py +210 -0
devguard/checkers/npm.py +327 -0
devguard/checkers/npm_security.py +244 -0
devguard/checkers/redteam.py +290 -0
devguard/checkers/secret.py +279 -0
devguard/checkers/swarm.py +376 -0
devguard/checkers/tailscale.py +143 -0
devguard/checkers/tailsnitch.py +303 -0
devguard/checkers/tavily.py +179 -0
devguard/checkers/vercel.py +192 -0
devguard/cli.py +1510 -0
devguard/cli_helpers.py +189 -0
devguard/config.py +249 -0
devguard/core.py +293 -0
devguard/dashboard.py +715 -0
devguard/discovery.py +363 -0
devguard/http_client.py +142 -0
devguard/llm_service.py +481 -0
devguard/mcp_server.py +259 -0
devguard/metrics.py +144 -0
devguard/models.py +208 -0
devguard/reporting.py +1571 -0
devguard/sarif.py +295 -0
devguard/scripts/ANALYSIS_SUMMARY.md +141 -0
devguard/scripts/README.md +221 -0
devguard/scripts/auto_fix_recommendations.py +145 -0
devguard/scripts/generate_npmignore.py +175 -0
devguard/scripts/generate_security_report.py +324 -0
devguard/scripts/prepublish_check.sh +29 -0
devguard/scripts/redteam_npm_packages.py +1262 -0
devguard/scripts/review_all_repos.py +300 -0
devguard/spec.py +617 -0
devguard/sweeps/__init__.py +23 -0
devguard/sweeps/ai_editor_config_audit.py +697 -0
devguard/sweeps/cargo_publish_audit.py +655 -0
devguard/sweeps/dependency_audit.py +419 -0
devguard/sweeps/gitignore_audit.py +336 -0
devguard/sweeps/local_dev.py +260 -0
devguard/sweeps/local_dirty_worktree_secrets.py +521 -0
devguard/sweeps/project_flaudit.py +636 -0
devguard/sweeps/public_github_secrets.py +680 -0
devguard/sweeps/publish_audit.py +478 -0
devguard/sweeps/ssh_key_audit.py +327 -0
devguard/utils.py +174 -0
devguard-0.2.0.dist-info/METADATA +225 -0
devguard-0.2.0.dist-info/RECORD +60 -0
devguard-0.2.0.dist-info/WHEEL +4 -0
devguard-0.2.0.dist-info/entry_points.txt +2 -0

devguard/sweeps/dependency_audit.py ADDED Viewed

@@ -0,0 +1,419 @@
+"""Dependency audit sweep: scan local repos for known vulnerabilities in dependencies.
+Discovers git repos under a dev root, detects language by manifest/lock files,
+and runs the appropriate audit tool (cargo-audit, npm audit, pip-audit).
+Produces a unified report with per-repo findings bucketed by severity.
+"""
+from __future__ import annotations
+import fnmatch
+import json
+import os
+import shutil
+import subprocess
+from collections import Counter
+from concurrent.futures import ThreadPoolExecutor, as_completed
+from dataclasses import dataclass, field
+from datetime import UTC, datetime
+from pathlib import Path
+from typing import Any
+def _utc_now() -> str:
+    return datetime.now(UTC).isoformat().replace("+00:00", "Z")
+def _default_dev_root() -> Path:
+    return Path(os.getenv("DEV_DIR") or "~/Documents/dev").expanduser()
+# ---------------------------------------------------------------------------
+# Repo discovery (same pattern as gitignore_audit)
+# ---------------------------------------------------------------------------
+def _iter_git_repos(root: Path, max_depth: int) -> list[Path]:
+    """Discover git repos under root, bounded by max_depth."""
+    root = root.resolve()
+    max_depth = max(0, min(int(max_depth), 6))
+    junk = {
+        "node_modules", ".venv", "venv", "dist", "build", ".git",
+        ".cache", ".state", "__pycache__", "_trash", "_scratch",
+        "_external", "_archive", "_forks",
+    }
+    repos: list[Path] = []
+    stack: list[tuple[Path, int]] = [(root, 0)]
+    seen: set[Path] = set()
+    while stack:
+        cur, depth = stack.pop()
+        if cur in seen:
+            continue
+        seen.add(cur)
+        if (cur / ".git").exists():
+            repos.append(cur)
+            continue
+        if depth >= max_depth:
+            continue
+        try:
+            for child in cur.iterdir():
+                if not child.is_dir():
+                    continue
+                name = child.name
+                if depth == 0 and name in junk:
+                    continue
+                if name.startswith("."):
+                    continue
+                stack.append((child, depth + 1))
+        except Exception:
+            continue
+    return sorted(repos)
+# ---------------------------------------------------------------------------
+# Language / engine detection
+# ---------------------------------------------------------------------------
+# Maps lock/manifest files to (language, engine_name).
+_MANIFEST_MAP: list[tuple[str, str, str]] = [
+    ("Cargo.lock", "rust", "cargo-audit"),
+    ("package-lock.json", "js", "npm-audit"),
+    ("yarn.lock", "js", "npm-audit"),
+    ("pnpm-lock.yaml", "js", "npm-audit"),
+    ("uv.lock", "python", "pip-audit"),
+    ("requirements.txt", "python", "pip-audit"),
+    ("poetry.lock", "python", "pip-audit"),
+]
+@dataclass(frozen=True)
+class DetectedEngine:
+    language: str
+    engine: str
+def detect_engines(repo: Path) -> list[DetectedEngine]:
+    """Detect which audit engines apply to a repo based on manifest files."""
+    seen_engines: set[str] = set()
+    results: list[DetectedEngine] = []
+    for filename, lang, engine in _MANIFEST_MAP:
+        if engine in seen_engines:
+            continue
+        if (repo / filename).exists():
+            seen_engines.add(engine)
+            results.append(DetectedEngine(language=lang, engine=engine))
+    return results
+# ---------------------------------------------------------------------------
+# JSON output parsers
+# ---------------------------------------------------------------------------
+SEVERITY_BUCKETS = ("critical", "high", "medium", "low")
+@dataclass
+class VulnSummary:
+    id: str
+    severity: str  # one of SEVERITY_BUCKETS or "unknown"
+    package: str
+    title: str
+def _cargo_severity_from_categories(categories: list[str]) -> str:
+    """Infer severity from cargo-audit advisory categories when no explicit severity."""
+    high_cats = {"memory-corruption", "memory-exposure", "code-execution"}
+    medium_cats = {"denial-of-service", "crypto-failure", "thread-safety"}
+    for cat in categories:
+        if cat in high_cats:
+            return "high"
+    for cat in categories:
+        if cat in medium_cats:
+            return "medium"
+    return "unknown"
+def parse_cargo_audit_json(raw: str) -> list[VulnSummary]:
+    """Parse `cargo audit --json` output."""
+    try:
+        data = json.loads(raw)
+    except (json.JSONDecodeError, ValueError):
+        return []
+    vulns: list[VulnSummary] = []
+    for v in data.get("vulnerabilities", {}).get("list", []):
+        advisory = v.get("advisory", {})
+        pkg = v.get("package", {})
+        # Try explicit severity, then CVSS, then infer from categories
+        sev_str = _normalize_severity(advisory.get("severity"))
+        if sev_str == "unknown" and advisory.get("cvss"):
+            sev_str = _normalize_severity(str(advisory["cvss"]).split("/")[0])
+        if sev_str == "unknown":
+            sev_str = _cargo_severity_from_categories(advisory.get("categories", []))
+        # Informational advisories (unmaintained, etc.) are low severity
+        if advisory.get("informational") is not None:
+            sev_str = "low"
+        vulns.append(VulnSummary(
+            id=advisory.get("id", "UNKNOWN"),
+            severity=sev_str,
+            package=pkg.get("name", "unknown"),
+            title=advisory.get("title", ""),
+        ))
+    return vulns
+def parse_npm_audit_json(raw: str) -> list[VulnSummary]:
+    """Parse `npm audit --json` output."""
+    try:
+        data = json.loads(raw)
+    except (json.JSONDecodeError, ValueError):
+        return []
+    vulns: list[VulnSummary] = []
+    # npm v7+ audit JSON uses "vulnerabilities" dict keyed by package name
+    vuln_dict = data.get("vulnerabilities", {})
+    if isinstance(vuln_dict, dict):
+        for pkg_name, info in vuln_dict.items():
+            if not isinstance(info, dict):
+                continue
+            sev_str = _normalize_severity(info.get("severity", "unknown"))
+            # Extract title from via list (first dict entry) or fall back to name
+            title = ""
+            via = info.get("via", [])
+            for v_item in via:
+                if isinstance(v_item, dict) and v_item.get("title"):
+                    title = v_item["title"]
+                    break
+            vulns.append(VulnSummary(
+                id=info.get("name", pkg_name),
+                severity=sev_str,
+                package=pkg_name,
+                title=title or pkg_name,
+            ))
+    return vulns
+def parse_pip_audit_json(raw: str) -> list[VulnSummary]:
+    """Parse `pip-audit --format=json` output."""
+    try:
+        data = json.loads(raw)
+    except (json.JSONDecodeError, ValueError):
+        return []
+    vulns: list[VulnSummary] = []
+    # pip-audit outputs a list of dicts, each with "name", "version", "vulns"
+    if isinstance(data, list):
+        for entry in data:
+            pkg = entry.get("name", "unknown")
+            for v in entry.get("vulns", []):
+                sev_str = _normalize_severity(v.get("fix_versions", [""])[0] if v.get("fix_versions") else "")
+                # pip-audit doesn't always include severity; use id-based lookup
+                vuln_id = v.get("id", "UNKNOWN")
+                desc = v.get("description", "")
+                # Attempt to extract severity from aliases or description
+                aliases = v.get("aliases", [])
+                sev_str = _normalize_severity(v.get("severity", "unknown"))
+                vulns.append(VulnSummary(
+                    id=vuln_id,
+                    severity=sev_str,
+                    package=pkg,
+                    title=desc[:120] if desc else vuln_id,
+                ))
+    return vulns
+def _normalize_severity(raw: str | None) -> str:
+    """Normalize severity string to one of the standard buckets."""
+    if not raw:
+        return "unknown"
+    low = raw.strip().lower()
+    if low in SEVERITY_BUCKETS:
+        return low
+    # Map common aliases
+    if low in ("info", "informational", "negligible", "none"):
+        return "low"
+    if low in ("moderate", "mod"):
+        return "medium"
+    return "unknown"
+# ---------------------------------------------------------------------------
+# Per-repo audit runner
+# ---------------------------------------------------------------------------
+_ENGINE_COMMANDS: dict[str, tuple[list[str], str | None]] = {
+    # (argv, which_binary_to_check)
+    "cargo-audit": (["cargo", "audit", "--json"], "cargo-audit"),
+    "npm-audit": (["npm", "audit", "--json"], "npm"),
+    "pip-audit": (["pip-audit", "--format=json", "--output=-"], "pip-audit"),
+}
+_ENGINE_PARSERS: dict[str, Any] = {
+    "cargo-audit": parse_cargo_audit_json,
+    "npm-audit": parse_npm_audit_json,
+    "pip-audit": parse_pip_audit_json,
+}
+@dataclass
+class RepoAuditResult:
+    repo_path: str
+    engines_run: list[str] = field(default_factory=list)
+    vulns: list[dict[str, str]] = field(default_factory=list)
+    severity_counts: dict[str, int] = field(default_factory=dict)
+    skipped_engines: list[str] = field(default_factory=list)
+    error: str | None = None
+def _audit_repo(
+    repo: Path,
+    engines: list[str],
+    timeout_s: int,
+) -> RepoAuditResult:
+    """Run applicable audit tools on a single repo."""
+    detected = detect_engines(repo)
+    result = RepoAuditResult(repo_path=str(repo))
+    counts: Counter[str] = Counter()
+    for det in detected:
+        if det.engine not in engines:
+            result.skipped_engines.append(det.engine)
+            continue
+        cmd_spec = _ENGINE_COMMANDS.get(det.engine)
+        if cmd_spec is None:
+            continue
+        argv, which_bin = cmd_spec
+        # Check tool availability
+        if which_bin and not shutil.which(which_bin):
+            result.skipped_engines.append(f"{det.engine} (not installed)")
+            continue
+        try:
+            proc = subprocess.run(
+                argv,
+                cwd=str(repo),
+                capture_output=True,
+                text=True,
+                timeout=timeout_s,
+            )
+            # cargo-audit and npm audit return non-zero when vulns are found;
+            # that is expected -- we still parse stdout.
+            raw = proc.stdout or ""
+        except subprocess.TimeoutExpired:
+            result.skipped_engines.append(f"{det.engine} (timeout)")
+            continue
+        except Exception as exc:
+            result.skipped_engines.append(f"{det.engine} ({exc})")
+            continue
+        parser = _ENGINE_PARSERS.get(det.engine)
+        if parser is None:
+            continue
+        vulns = parser(raw)
+        result.engines_run.append(det.engine)
+        for v in vulns:
+            result.vulns.append({
+                "id": v.id,
+                "severity": v.severity,
+                "package": v.package,
+                "title": v.title,
+                "engine": det.engine,
+            })
+            counts[v.severity] += 1
+    result.severity_counts = dict(counts)
+    return result
+# ---------------------------------------------------------------------------
+# Main entry point
+# ---------------------------------------------------------------------------
+def audit_dependencies(
+    *,
+    dev_root: Path | None = None,
+    max_depth: int = 2,
+    exclude_repo_globs: list[str] | None = None,
+    engines: list[str] | None = None,
+    max_concurrency: int = 4,
+    timeout_s: int = 120,
+) -> tuple[dict[str, Any], list[str]]:
+    """Audit dependencies across local repos for known vulnerabilities.
+    Returns (report_dict, errors_list).
+    """
+    errors: list[str] = []
+    root = dev_root if dev_root is not None else _default_dev_root()
+    all_engines = engines or ["cargo-audit", "npm-audit", "pip-audit"]
+    repos = _iter_git_repos(root, max_depth=max_depth)
+    globs = [g for g in (exclude_repo_globs or []) if isinstance(g, str) and g.strip()]
+    if globs:
+        repos = [r for r in repos if not any(fnmatch.fnmatch(str(r), g) for g in globs)]
+    results: list[RepoAuditResult] = []
+    def _run(repo: Path) -> RepoAuditResult:
+        try:
+            return _audit_repo(repo, engines=all_engines, timeout_s=timeout_s)
+        except Exception as exc:
+            return RepoAuditResult(repo_path=str(repo), error=str(exc))
+    with ThreadPoolExecutor(max_workers=max_concurrency) as pool:
+        futures = {pool.submit(_run, r): r for r in repos}
+        for fut in as_completed(futures):
+            res = fut.result()
+            results.append(res)
+            if res.error:
+                errors.append(f"{res.repo_path}: {res.error}")
+    # Sort by severity (critical first), then by vuln count descending
+    def _sort_key(r: RepoAuditResult) -> tuple[int, int, str]:
+        crit = r.severity_counts.get("critical", 0)
+        high = r.severity_counts.get("high", 0)
+        total = len(r.vulns)
+        return (-crit, -high, -total, r.repo_path)  # type: ignore[return-value]
+    results.sort(key=_sort_key)
+    # Aggregate severity counts
+    total_counts: Counter[str] = Counter()
+    for r in results:
+        total_counts.update(r.severity_counts)
+    repos_with_vulns = [r for r in results if r.vulns]
+    report: dict[str, Any] = {
+        "generated_at": _utc_now(),
+        "scope": {
+            "dev_root": str(root),
+            "repos_scanned": len(repos),
+            "max_depth": max_depth,
+            "exclude_repo_globs": globs,
+            "engines_requested": all_engines,
+        },
+        "summary": {
+            "repos_with_vulns": len(repos_with_vulns),
+            "total_vulns": sum(len(r.vulns) for r in results),
+            "severity_counts": {s: total_counts.get(s, 0) for s in SEVERITY_BUCKETS},
+            "unknown_severity": total_counts.get("unknown", 0),
+        },
+        "repos": [
+            {
+                "repo_path": r.repo_path,
+                "engines_run": r.engines_run,
+                "skipped_engines": r.skipped_engines,
+                "vuln_count": len(r.vulns),
+                "severity_counts": r.severity_counts,
+                "vulns": r.vulns[:100],  # cap per repo
+            }
+            for r in results
+            if r.vulns or r.skipped_engines
+        ][:200],
+        "errors": errors,
+    }
+    return report, errors
+def write_report(path: Path, report: dict[str, Any]) -> None:
+    path.parent.mkdir(parents=True, exist_ok=True)
+    path.write_text(json.dumps(report, indent=2) + "\n")