PyPI - python-checkup - Versions diffs - 0.0.1__py3-none-any.whl - Mend

python-checkup 0.0.1__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (53) hide show

python_checkup/__init__.py +9 -0
python_checkup/__main__.py +3 -0
python_checkup/analysis_request.py +35 -0
python_checkup/analyzer_catalog.py +100 -0
python_checkup/analyzers/__init__.py +54 -0
python_checkup/analyzers/bandit.py +158 -0
python_checkup/analyzers/basedpyright.py +103 -0
python_checkup/analyzers/cached.py +106 -0
python_checkup/analyzers/dependency_vulns.py +298 -0
python_checkup/analyzers/deptry.py +142 -0
python_checkup/analyzers/detect_secrets.py +101 -0
python_checkup/analyzers/mypy.py +217 -0
python_checkup/analyzers/radon.py +150 -0
python_checkup/analyzers/registry.py +69 -0
python_checkup/analyzers/ruff.py +256 -0
python_checkup/analyzers/typos.py +80 -0
python_checkup/analyzers/vulture.py +151 -0
python_checkup/cache.py +244 -0
python_checkup/cli.py +763 -0
python_checkup/config.py +87 -0
python_checkup/dedup.py +119 -0
python_checkup/dependencies/discovery.py +192 -0
python_checkup/detection.py +298 -0
python_checkup/diff.py +130 -0
python_checkup/discovery.py +180 -0
python_checkup/formatters/__init__.py +0 -0
python_checkup/formatters/badge.py +38 -0
python_checkup/formatters/json_fmt.py +22 -0
python_checkup/formatters/terminal.py +396 -0
python_checkup/mcp/__init__.py +3 -0
python_checkup/mcp/installer.py +119 -0
python_checkup/mcp/server.py +411 -0
python_checkup/models.py +114 -0
python_checkup/plan.py +109 -0
python_checkup/progress.py +95 -0
python_checkup/runner.py +438 -0
python_checkup/scoring/__init__.py +0 -0
python_checkup/scoring/engine.py +397 -0
python_checkup/skills/SKILL.md +416 -0
python_checkup/skills/__init__.py +0 -0
python_checkup/skills/agents.py +98 -0
python_checkup/skills/installer.py +248 -0
python_checkup/skills/rule_db.py +806 -0
python_checkup/web/__init__.py +0 -0
python_checkup/web/server.py +285 -0
python_checkup/web/static/__init__.py +0 -0
python_checkup/web/static/index.html +959 -0
python_checkup/web/template.py +26 -0
python_checkup-0.0.1.dist-info/METADATA +250 -0
python_checkup-0.0.1.dist-info/RECORD +53 -0
python_checkup-0.0.1.dist-info/WHEEL +4 -0
python_checkup-0.0.1.dist-info/entry_points.txt +14 -0
python_checkup-0.0.1.dist-info/licenses/LICENSE +21 -0

python_checkup/progress.py ADDED Viewed

@@ -0,0 +1,95 @@
+from __future__ import annotations
+import sys
+from collections.abc import Generator
+from contextlib import contextmanager
+from rich.console import Console
+from rich.progress import (
+    BarColumn,
+    Progress,
+    SpinnerColumn,
+    TaskID,
+    TextColumn,
+    TimeElapsedColumn,
+)
+@contextmanager
+def analysis_progress(
+    analyzer_names: list[str],
+    *,
+    quiet: bool = False,
+) -> Generator[AnalysisTracker, None, None]:
+    """Context manager that shows a progress display during analysis.
+    Args:
+        analyzer_names: Names of analyzers that will run.
+        quiet: If True, suppress all output (for --score and --json).
+    """
+    if quiet:
+        yield AnalysisTracker(progress=None, tasks={})
+        return
+    console = Console(file=sys.stderr)
+    progress = Progress(
+        SpinnerColumn(),
+        TextColumn("[bold blue]{task.description}[/bold blue]"),
+        BarColumn(bar_width=20),
+        TextColumn("[dim]{task.fields[status]}[/dim]"),
+        TimeElapsedColumn(),
+        console=console,
+        transient=True,
+    )
+    with progress:
+        tasks: dict[str, TaskID] = {}
+        for name in analyzer_names:
+            task_id = progress.add_task(f"  {name}", total=1, status="waiting...")
+            tasks[name] = task_id
+        yield AnalysisTracker(progress=progress, tasks=tasks)
+class AnalysisTracker:
+    """Tracks progress of individual analyzers."""
+    def __init__(
+        self,
+        progress: Progress | None,
+        tasks: dict[str, TaskID],
+    ) -> None:
+        self._progress = progress
+        self._tasks = tasks
+    def start(self, analyzer_name: str) -> None:
+        if self._progress and analyzer_name in self._tasks:
+            self._progress.update(
+                self._tasks[analyzer_name],
+                status="running...",
+            )
+    def complete(self, analyzer_name: str, issue_count: int) -> None:
+        if self._progress and analyzer_name in self._tasks:
+            status = f"done ({issue_count} issues)" if issue_count else "done"
+            self._progress.update(
+                self._tasks[analyzer_name],
+                completed=1,
+                status=status,
+            )
+    def fail(self, analyzer_name: str, error: str) -> None:
+        if self._progress and analyzer_name in self._tasks:
+            self._progress.update(
+                self._tasks[analyzer_name],
+                completed=1,
+                status=f"[red]failed: {error}[/red]",
+            )
+    def skip(self, analyzer_name: str) -> None:
+        if self._progress and analyzer_name in self._tasks:
+            self._progress.update(
+                self._tasks[analyzer_name],
+                completed=1,
+                status="[dim]skipped[/dim]",
+            )

python_checkup/runner.py ADDED Viewed

@@ -0,0 +1,438 @@
+from __future__ import annotations
+import asyncio
+import logging
+import sys
+import time
+from pathlib import Path
+from typing import TYPE_CHECKING
+from python_checkup.analysis_request import AnalysisRequest
+from python_checkup.analyzer_catalog import ANALYZER_CATALOG, get_analyzer_info
+from python_checkup.analyzers.cached import CachedAnalyzer
+from python_checkup.analyzers.registry import discover_analyzers
+from python_checkup.cache import AnalysisCache
+from python_checkup.config import CheckupConfig
+from python_checkup.dedup import deduplicate
+from python_checkup.detection import detect_framework
+from python_checkup.discovery import discover_python_files
+from python_checkup.models import (
+    Category,
+    CategoryCoverage,
+    CoverageInfo,
+    Diagnostic,
+    HealthReport,
+    ProjectInfo,
+)
+from python_checkup.plan import PROFILE_DEFAULT, ScanPlan, build_scan_plan
+from python_checkup.progress import analysis_progress
+from python_checkup.scoring.engine import compute_health_report
+if TYPE_CHECKING:
+    from python_checkup.analyzers import Analyzer
+logger = logging.getLogger("python_checkup")
+# Analyzers that benefit from per-file caching.
+# mypy is excluded because it needs project-wide context
+# (it relies on its own .mypy_cache/ instead).
+CACHEABLE_ANALYZERS = {"ruff", "bandit", "radon", "vulture"}
+def _detect_project_framework(
+    project_root: Path,
+) -> tuple[str | None, str | None]:
+    """Detect the project framework and return (name, label)."""
+    framework_info = detect_framework(project_root)
+    if not framework_info:
+        return None, None
+    name = framework_info.name
+    label = (
+        f"{framework_info.name}-{framework_info.version}"
+        if framework_info.version
+        else framework_info.name
+    )
+    return name, label
+def _filter_analyzers(
+    all_analyzers: list[Analyzer],
+    skip_analyzers: set[str],
+    plan: ScanPlan,
+    cache: AnalysisCache,
+) -> tuple[list[Analyzer | CachedAnalyzer], list[str], list[str]]:
+    """Filter analyzers based on skip list, plan, and cache settings.
+    Returns (active, skipped_names, optional_unavailable).
+    """
+    active: list[Analyzer | CachedAnalyzer] = []
+    skipped_names = [a.name for a in all_analyzers if a.name in skip_analyzers]
+    optional_unavailable: list[str] = []
+    for a in all_analyzers:
+        if a.name in skip_analyzers:
+            continue
+        if _should_skip_analyzer(a.name, plan, skipped_names, optional_unavailable):
+            continue
+        if a.name in CACHEABLE_ANALYZERS and cache.enabled:
+            active.append(CachedAnalyzer(a, cache))
+        else:
+            active.append(a)
+    return active, skipped_names, optional_unavailable
+def _should_skip_analyzer(
+    name: str,
+    plan: ScanPlan,
+    skipped_names: list[str],
+    optional_unavailable: list[str],
+) -> bool:
+    """Check if an analyzer should be skipped based on catalog info and plan."""
+    info = get_analyzer_info(name)
+    if info is None:
+        return False
+    if not info.categories.intersection(plan.categories):
+        skipped_names.append(name)
+        return True
+    if plan.profile not in info.profiles:
+        skipped_names.append(name)
+        return True
+    if info.optional and not plan.include_optional:
+        optional_unavailable.append(name)
+        skipped_names.append(name)
+        return True
+    return False
+def _collect_results(
+    results: list[tuple[str, list[Diagnostic] | None, dict[str, object]]],
+) -> tuple[list[Diagnostic], list[str], list[float], list[str]]:
+    """Collect diagnostics, used analyzers, MI scores, and failed names from results."""
+    all_diagnostics: list[Diagnostic] = []
+    analyzers_used: list[str] = []
+    mi_scores: list[float] = []
+    failed_names: list[str] = []
+    for name, result, cfg in results:
+        if result is not None:
+            all_diagnostics.extend(result)
+            analyzers_used.append(name)
+            if name == "radon" and "_radon_mi_scores" in cfg:
+                raw_mi = cfg["_radon_mi_scores"]
+                if isinstance(raw_mi, list):
+                    mi_scores = raw_mi
+        else:
+            failed_names.append(name)
+    return all_diagnostics, analyzers_used, mi_scores, failed_names
+def _handle_cache_stats(cache: AnalysisCache) -> dict[str, int] | None:
+    """Collect cache statistics and run cleanup if cache is enabled."""
+    if not cache.enabled:
+        return None
+    cache_stats = cache.get_stats()
+    logger.info(
+        "Cache: %d hits, %d misses (%d%% hit rate)",
+        cache_stats["hits"],
+        cache_stats["misses"],
+        cache_stats["hit_rate_pct"],
+    )
+    cache.cleanup()
+    return cache_stats
+async def run_analysis(
+    project_root: Path,
+    config: CheckupConfig,
+    files: list[Path] | None = None,
+    skip_analyzers: set[str] | None = None,
+    quiet: bool = False,
+    no_cache: bool = False,
+    plan: ScanPlan | None = None,
+    diff_base: str | None = None,
+) -> HealthReport:
+    """Run all available analyzers with progress feedback.
+    Args:
+        project_root: Root directory to analyze.
+        config: Resolved configuration.
+        files: Specific files to analyze. If None, discovers all.
+        skip_analyzers: Set of analyzer names to skip.
+        quiet: Suppress progress output (for --score and --json).
+        no_cache: If True, skip the cache entirely (fresh run).
+    """
+    start = time.monotonic()
+    skip_analyzers = skip_analyzers or set()
+    plan = plan or build_scan_plan(profile=PROFILE_DEFAULT)
+    if files is None:
+        files = discover_python_files(project_root, config.ignore_files)
+    if not files:
+        return _empty_report(start)
+    cache = AnalysisCache(project_root, enabled=not no_cache)
+    framework_name, framework_label = _detect_project_framework(project_root)
+    all_analyzers = await discover_analyzers()
+    active, skipped_names, optional_unavailable = _filter_analyzers(
+        all_analyzers, skip_analyzers, plan, cache
+    )
+    if not active:
+        logger.warning("No analyzers available after filtering")
+        return _empty_report(start)
+    # Run with progress tracking
+    with analysis_progress([a.name for a in active], quiet=quiet) as tracker:
+        async def run_one(
+            analyzer: Analyzer | CachedAnalyzer,
+            request: AnalysisRequest,
+        ) -> tuple[str, list[Diagnostic] | None, dict[str, object]]:
+            tracker.start(analyzer.name)
+            try:
+                result = await analyzer.analyze(request)
+                tracker.complete(analyzer.name, len(result))
+                return analyzer.name, result, request.metadata
+            except asyncio.TimeoutError:
+                tracker.fail(analyzer.name, "timed out")
+                logger.warning("%s timed out", analyzer.name)
+                return analyzer.name, None, request.metadata
+            except Exception as e:
+                error_str = str(e)[:50]
+                tracker.fail(analyzer.name, error_str)
+                logger.warning(
+                    "%s failed: %s: %s",
+                    analyzer.name,
+                    type(e).__name__,
+                    e,
+                )
+                return analyzer.name, None, request.metadata
+        tasks = []
+        for a in active:
+            request = AnalysisRequest(
+                project_root=project_root,
+                files=files,
+                config=config,
+                categories=set(plan.categories),
+                profile=plan.profile,
+                framework=framework_name,
+                diff_base=diff_base,
+                quiet=quiet,
+                no_cache=no_cache,
+                metadata={},
+            )
+            tasks.append(run_one(a, request))
+        results = await asyncio.gather(*tasks)
+    all_diagnostics, analyzers_used, mi_scores, failed_names = _collect_results(results)
+    skipped_names.extend(failed_names)
+    cache_stats = _handle_cache_stats(cache)
+    # Deduplicate (Ruff/Bandit overlap)
+    all_diagnostics = deduplicate(all_diagnostics)
+    if config.ignore_rules:
+        all_diagnostics = [
+            d for d in all_diagnostics if d.rule_id not in config.ignore_rules
+        ]
+    total_lines = sum(_count_lines(f) for f in files)
+    project = ProjectInfo(
+        python_version=_detect_python_version(),
+        framework=framework_label,
+        total_files=len(files),
+        total_lines=total_lines,
+    )
+    duration_ms = int((time.monotonic() - start) * 1000)
+    coverage = _build_coverage(
+        plan=plan,
+        analyzers_used=analyzers_used,
+        analyzers_skipped=skipped_names,
+        optional_unavailable=optional_unavailable,
+        request_metadata={
+            key: value
+            for _name, _result, metadata in results
+            for key, value in metadata.items()
+        },
+    )
+    return compute_health_report(
+        diagnostics=all_diagnostics,
+        project=project,
+        config=config,
+        duration_ms=duration_ms,
+        analyzers_used=analyzers_used,
+        analyzers_skipped=skipped_names,
+        mi_scores=mi_scores if mi_scores else None,
+        cache_stats=cache_stats,
+        coverage=coverage,
+    )
+def _count_lines(path: Path) -> int:
+    """Count lines in a file, handling encoding errors."""
+    try:
+        return len(path.read_text(errors="ignore").splitlines())
+    except OSError:
+        return 0
+def _detect_python_version() -> str:
+    return f"{sys.version_info.major}.{sys.version_info.minor}"
+def _empty_report(start: float) -> HealthReport:
+    return HealthReport(
+        score=100,
+        label="Healthy",
+        category_scores=[],
+        diagnostics=[],
+        project=ProjectInfo(
+            python_version=_detect_python_version(),
+            framework=None,
+            total_files=0,
+            total_lines=0,
+        ),
+        duration_ms=int((time.monotonic() - start) * 1000),
+        coverage=CoverageInfo(profile=PROFILE_DEFAULT, confidence="limited"),
+    )
+def _categorize_coverage(
+    plan: ScanPlan,
+    used_set: set[str],
+    optional_unavailable: list[str],
+) -> tuple[set[Category], list[CategoryCoverage], list[str]]:
+    """Classify each planned category as scored, partial, or unavailable.
+    Returns (scored_categories, category_coverage, partial_reasons).
+    """
+    scored_categories: set[Category] = set()
+    category_coverage: list[CategoryCoverage] = []
+    partial_reasons: list[str] = []
+    for category in sorted(plan.categories, key=lambda c: c.value):
+        category_analyzers = [
+            info.name
+            for info in ANALYZER_CATALOG.values()
+            if category in info.categories
+            and plan.profile in info.profiles
+            and (plan.include_optional or not info.optional)
+        ]
+        used_for_category = [name for name in category_analyzers if name in used_set]
+        if used_for_category:
+            status, reason = _category_status(category, optional_unavailable)
+            category_coverage.append(
+                CategoryCoverage(
+                    category=category,
+                    status=status,
+                    analyzers=used_for_category,
+                    reason=reason,
+                )
+            )
+            scored_categories.add(category)
+            if reason:
+                partial_reasons.append(f"{category.value}: {reason}")
+        else:
+            category_coverage.append(
+                CategoryCoverage(
+                    category=category,
+                    status="unavailable",
+                    analyzers=[],
+                    reason="no analyzer ran for this category",
+                )
+            )
+    # Add entries for categories explicitly skipped by the user
+    for category in sorted(plan.skipped_categories, key=lambda c: c.value):
+        category_coverage.append(
+            CategoryCoverage(
+                category=category,
+                status="skipped_by_user",
+                analyzers=[],
+                reason="excluded via --skip",
+            )
+        )
+    return scored_categories, category_coverage, partial_reasons
+def _category_status(
+    category: Category,
+    optional_unavailable: list[str],
+) -> tuple[str, str]:
+    """Return (status, reason) for a category that has at least one active analyzer."""
+    if category == Category.SECURITY and "detect-secrets" in optional_unavailable:
+        return "partial", "optional secret scan not installed"
+    if category == Category.DEPENDENCIES and "dependency-vulns" in optional_unavailable:
+        return "partial", "optional dependency vulnerability scan not installed"
+    return "scored", ""
+def _build_provenance(request_metadata: dict[str, object]) -> list[str]:
+    """Build provenance notes from request metadata."""
+    provenance: list[str] = []
+    dep_source = request_metadata.get("dependency_vulns_source")
+    dep_count = request_metadata.get("dependency_vulns_package_count")
+    dep_note = request_metadata.get("dependency_vulns_note")
+    if isinstance(dep_source, str) and isinstance(dep_count, int):
+        provenance.append(
+            f"Dependency vulnerabilities: scanned from {dep_source} "
+            f"({dep_count} packages)"
+        )
+    elif isinstance(dep_note, str):
+        provenance.append(f"Dependency vulnerabilities: skipped ({dep_note})")
+    return provenance
+def _determine_confidence(
+    partial_reasons: list[str],
+    scored_categories: set[Category],
+    plan: ScanPlan,
+) -> str:
+    """Determine the confidence level based on coverage gaps."""
+    if len(scored_categories) < len(plan.categories):
+        return "limited"
+    if partial_reasons:
+        return "partial"
+    return "full"
+def _build_coverage(
+    *,
+    plan: ScanPlan,
+    analyzers_used: list[str],
+    analyzers_skipped: list[str],
+    optional_unavailable: list[str],
+    request_metadata: dict[str, object] | None = None,
+) -> CoverageInfo:
+    used_set = set(analyzers_used)
+    request_metadata = request_metadata or {}
+    scored_categories, category_coverage, partial_reasons = _categorize_coverage(
+        plan, used_set, optional_unavailable
+    )
+    confidence = _determine_confidence(partial_reasons, scored_categories, plan)
+    provenance = _build_provenance(request_metadata)
+    return CoverageInfo(
+        profile=plan.profile,
+        confidence=confidence,
+        requested_categories=sorted(plan.categories, key=lambda c: c.value),
+        scored_categories=sorted(scored_categories, key=lambda c: c.value),
+        category_coverage=category_coverage,
+        analyzers_used=analyzers_used,
+        analyzers_missing=[],
+        analyzers_optional_unavailable=optional_unavailable,
+        partial_reasons=partial_reasons,
+        provenance=provenance,
+    )

python_checkup/scoring/__init__.py ADDED Viewed

File without changes