PyPI - crackerjack - Versions diffs - 0.31.10__py3-none-any.whl → 0.31.12__py3-none-any.whl - Mend

crackerjack 0.31.10py3-none-any.whl → 0.31.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of crackerjack might be problematic. Click here for more details.

Files changed (155) hide show

crackerjack/CLAUDE.md +288 -705
crackerjack/__main__.py +22 -8
crackerjack/agents/__init__.py +0 -3
crackerjack/agents/architect_agent.py +0 -43
crackerjack/agents/base.py +1 -9
crackerjack/agents/coordinator.py +2 -148
crackerjack/agents/documentation_agent.py +109 -81
crackerjack/agents/dry_agent.py +122 -97
crackerjack/agents/formatting_agent.py +3 -16
crackerjack/agents/import_optimization_agent.py +1174 -130
crackerjack/agents/performance_agent.py +956 -188
crackerjack/agents/performance_helpers.py +229 -0
crackerjack/agents/proactive_agent.py +1 -48
crackerjack/agents/refactoring_agent.py +516 -246
crackerjack/agents/refactoring_helpers.py +282 -0
crackerjack/agents/security_agent.py +393 -90
crackerjack/agents/test_creation_agent.py +1776 -120
crackerjack/agents/test_specialist_agent.py +59 -15
crackerjack/agents/tracker.py +0 -102
crackerjack/api.py +145 -37
crackerjack/cli/handlers.py +48 -30
crackerjack/cli/interactive.py +11 -11
crackerjack/cli/options.py +66 -4
crackerjack/code_cleaner.py +808 -148
crackerjack/config/global_lock_config.py +110 -0
crackerjack/config/hooks.py +43 -64
crackerjack/core/async_workflow_orchestrator.py +247 -97
crackerjack/core/autofix_coordinator.py +192 -109
crackerjack/core/enhanced_container.py +46 -63
crackerjack/core/file_lifecycle.py +549 -0
crackerjack/core/performance.py +9 -8
crackerjack/core/performance_monitor.py +395 -0
crackerjack/core/phase_coordinator.py +281 -94
crackerjack/core/proactive_workflow.py +9 -58
crackerjack/core/resource_manager.py +501 -0
crackerjack/core/service_watchdog.py +490 -0
crackerjack/core/session_coordinator.py +4 -8
crackerjack/core/timeout_manager.py +504 -0
crackerjack/core/websocket_lifecycle.py +475 -0
crackerjack/core/workflow_orchestrator.py +343 -209
crackerjack/dynamic_config.py +47 -6
crackerjack/errors.py +3 -4
crackerjack/executors/async_hook_executor.py +63 -13
crackerjack/executors/cached_hook_executor.py +14 -14
crackerjack/executors/hook_executor.py +100 -37
crackerjack/executors/hook_lock_manager.py +856 -0
crackerjack/executors/individual_hook_executor.py +120 -86
crackerjack/intelligence/__init__.py +0 -7
crackerjack/intelligence/adaptive_learning.py +13 -86
crackerjack/intelligence/agent_orchestrator.py +15 -78
crackerjack/intelligence/agent_registry.py +12 -59
crackerjack/intelligence/agent_selector.py +31 -92
crackerjack/intelligence/integration.py +1 -41
crackerjack/interactive.py +9 -9
crackerjack/managers/async_hook_manager.py +25 -8
crackerjack/managers/hook_manager.py +9 -9
crackerjack/managers/publish_manager.py +57 -59
crackerjack/managers/test_command_builder.py +6 -36
crackerjack/managers/test_executor.py +9 -61
crackerjack/managers/test_manager.py +17 -63
crackerjack/managers/test_manager_backup.py +77 -127
crackerjack/managers/test_progress.py +4 -23
crackerjack/mcp/cache.py +5 -12
crackerjack/mcp/client_runner.py +10 -10
crackerjack/mcp/context.py +64 -6
crackerjack/mcp/dashboard.py +14 -11
crackerjack/mcp/enhanced_progress_monitor.py +55 -55
crackerjack/mcp/file_monitor.py +72 -42
crackerjack/mcp/progress_components.py +103 -84
crackerjack/mcp/progress_monitor.py +122 -49
crackerjack/mcp/rate_limiter.py +12 -12
crackerjack/mcp/server_core.py +16 -22
crackerjack/mcp/service_watchdog.py +26 -26
crackerjack/mcp/state.py +15 -0
crackerjack/mcp/tools/core_tools.py +95 -39
crackerjack/mcp/tools/error_analyzer.py +6 -32
crackerjack/mcp/tools/execution_tools.py +1 -56
crackerjack/mcp/tools/execution_tools_backup.py +35 -131
crackerjack/mcp/tools/intelligence_tool_registry.py +0 -36
crackerjack/mcp/tools/intelligence_tools.py +2 -55
crackerjack/mcp/tools/monitoring_tools.py +308 -145
crackerjack/mcp/tools/proactive_tools.py +12 -42
crackerjack/mcp/tools/progress_tools.py +23 -15
crackerjack/mcp/tools/utility_tools.py +3 -40
crackerjack/mcp/tools/workflow_executor.py +40 -60
crackerjack/mcp/websocket/app.py +0 -3
crackerjack/mcp/websocket/endpoints.py +206 -268
crackerjack/mcp/websocket/jobs.py +213 -66
crackerjack/mcp/websocket/server.py +84 -6
crackerjack/mcp/websocket/websocket_handler.py +137 -29
crackerjack/models/config_adapter.py +3 -16
crackerjack/models/protocols.py +162 -3
crackerjack/models/resource_protocols.py +454 -0
crackerjack/models/task.py +3 -3
crackerjack/monitoring/__init__.py +0 -0
crackerjack/monitoring/ai_agent_watchdog.py +25 -71
crackerjack/monitoring/regression_prevention.py +28 -87
crackerjack/orchestration/advanced_orchestrator.py +44 -78
crackerjack/orchestration/coverage_improvement.py +10 -60
crackerjack/orchestration/execution_strategies.py +16 -16
crackerjack/orchestration/test_progress_streamer.py +61 -53
crackerjack/plugins/base.py +1 -1
crackerjack/plugins/managers.py +22 -20
crackerjack/py313.py +65 -21
crackerjack/services/backup_service.py +467 -0
crackerjack/services/bounded_status_operations.py +627 -0
crackerjack/services/cache.py +7 -9
crackerjack/services/config.py +35 -52
crackerjack/services/config_integrity.py +5 -16
crackerjack/services/config_merge.py +542 -0
crackerjack/services/contextual_ai_assistant.py +17 -19
crackerjack/services/coverage_ratchet.py +44 -73
crackerjack/services/debug.py +25 -39
crackerjack/services/dependency_monitor.py +52 -50
crackerjack/services/enhanced_filesystem.py +14 -11
crackerjack/services/file_hasher.py +1 -1
crackerjack/services/filesystem.py +1 -12
crackerjack/services/git.py +71 -47
crackerjack/services/health_metrics.py +31 -27
crackerjack/services/initialization.py +276 -428
crackerjack/services/input_validator.py +760 -0
crackerjack/services/log_manager.py +16 -16
crackerjack/services/logging.py +7 -6
crackerjack/services/metrics.py +43 -43
crackerjack/services/pattern_cache.py +2 -31
crackerjack/services/pattern_detector.py +26 -63
crackerjack/services/performance_benchmarks.py +20 -45
crackerjack/services/regex_patterns.py +2887 -0
crackerjack/services/regex_utils.py +537 -0
crackerjack/services/secure_path_utils.py +683 -0
crackerjack/services/secure_status_formatter.py +534 -0
crackerjack/services/secure_subprocess.py +605 -0
crackerjack/services/security.py +47 -10
crackerjack/services/security_logger.py +492 -0
crackerjack/services/server_manager.py +109 -50
crackerjack/services/smart_scheduling.py +8 -25
crackerjack/services/status_authentication.py +603 -0
crackerjack/services/status_security_manager.py +442 -0
crackerjack/services/thread_safe_status_collector.py +546 -0
crackerjack/services/tool_version_service.py +1 -23
crackerjack/services/unified_config.py +36 -58
crackerjack/services/validation_rate_limiter.py +269 -0
crackerjack/services/version_checker.py +9 -40
crackerjack/services/websocket_resource_limiter.py +572 -0
crackerjack/slash_commands/__init__.py +52 -2
crackerjack/tools/__init__.py +0 -0
crackerjack/tools/validate_input_validator_patterns.py +262 -0
crackerjack/tools/validate_regex_patterns.py +198 -0
{crackerjack-0.31.10.dist-info → crackerjack-0.31.12.dist-info}/METADATA +197 -12
crackerjack-0.31.12.dist-info/RECORD +178 -0
crackerjack/cli/facade.py +0 -104
crackerjack-0.31.10.dist-info/RECORD +0 -149
{crackerjack-0.31.10.dist-info → crackerjack-0.31.12.dist-info}/WHEEL +0 -0
{crackerjack-0.31.10.dist-info → crackerjack-0.31.12.dist-info}/entry_points.txt +0 -0
{crackerjack-0.31.10.dist-info → crackerjack-0.31.12.dist-info}/licenses/LICENSE +0 -0

crackerjack/code_cleaner.py CHANGED Viewed

@@ -1,7 +1,6 @@
 import ast
 import typing as t
 from dataclasses import dataclass
-from enum import Enum
 from pathlib import Path
 from typing import Protocol
@@ -9,12 +8,49 @@ from pydantic import BaseModel, ConfigDict
 from rich.console import Console
 from .errors import ErrorCode, ExecutionError
-class CleaningStepResult(Enum):
-    SUCCESS = "success"
-    FAILED = "failed"
-    SKIPPED = "skipped"
+from .services.backup_service import BackupMetadata, PackageBackupService
+from .services.regex_patterns import SAFE_PATTERNS
+from .services.secure_path_utils import (
+    AtomicFileOperations,
+    SecurePathValidator,
+)
+from .services.security_logger import (
+    SecurityEventLevel,
+    SecurityEventType,
+    get_security_logger,
+)
+class SafePatternApplicator:
+    """Safe pattern applicator using centralized SAFE_PATTERNS."""
+    def apply_docstring_patterns(self, code: str) -> str:
+        """Apply docstring removal patterns safely."""
+        result = code
+        result = SAFE_PATTERNS["docstring_triple_double"].apply(result)
+        result = SAFE_PATTERNS["docstring_triple_single"].apply(result)
+        return result
+    def apply_formatting_patterns(self, content: str) -> str:
+        """Apply formatting patterns safely."""
+        # Apply spacing patterns
+        content = SAFE_PATTERNS["spacing_after_comma"].apply(content)
+        content = SAFE_PATTERNS["spacing_after_colon"].apply(content)
+        content = SAFE_PATTERNS["multiple_spaces"].apply(content)
+        return content
+    def has_preserved_comment(self, line: str) -> bool:
+        """Check if a line contains preserved comments."""
+        if line.strip().startswith("#! /"):
+            return True
+        # Check for preserved comment keywords
+        line_lower = line.lower()
+        preserved_keywords = ["coding:", "encoding:", "type:", "noqa", "pragma"]
+        return any(keyword in line_lower for keyword in preserved_keywords)
+_safe_applicator = SafePatternApplicator()
 @dataclass
@@ -26,12 +62,18 @@ class CleaningResult:
     warnings: list[str]
     original_size: int
     cleaned_size: int
+    backup_metadata: BackupMetadata | None = None
-class FileProcessorProtocol(Protocol):
-    def read_file_safely(self, file_path: Path) -> str: ...
-    def write_file_safely(self, file_path: Path, content: str) -> None: ...
-    def backup_file(self, file_path: Path) -> Path: ...
+@dataclass
+class PackageCleaningResult:
+    total_files: int
+    successful_files: int
+    failed_files: int
+    file_results: list[CleaningResult]
+    backup_metadata: BackupMetadata | None
+    backup_restored: bool = False
+    overall_success: bool = False
 class CleaningStepProtocol(Protocol):
@@ -41,21 +83,13 @@ class CleaningStepProtocol(Protocol):
     def name(self) -> str: ...
-class ErrorHandlerProtocol(Protocol):
-    def handle_file_error(
-        self,
-        file_path: Path,
-        error: Exception,
-        step: str,
-    ) -> None: ...
-    def log_cleaning_result(self, result: CleaningResult) -> None: ...
 class FileProcessor(BaseModel):
-    model_config = ConfigDict(arbitrary_types_allowed=True)
+    model_config = ConfigDict(arbitrary_types_allowed=True, extra="allow")
     console: Console
     logger: t.Any = None
+    base_directory: Path | None = None
+    security_logger: t.Any = None
     def model_post_init(self, _: t.Any) -> None:
         if self.logger is None:
@@ -63,24 +97,55 @@ class FileProcessor(BaseModel):
             self.logger = logging.getLogger("crackerjack.code_cleaner.file_processor")
+        if self.security_logger is None:
+            self.security_logger = get_security_logger()
     def read_file_safely(self, file_path: Path) -> str:
+        validated_path = SecurePathValidator.validate_file_path(
+            file_path, self.base_directory
+        )
+        SecurePathValidator.validate_file_size(validated_path)
+        self.security_logger.log_security_event(
+            SecurityEventType.FILE_CLEANED,
+            SecurityEventLevel.LOW,
+            f"Reading file for cleaning: {validated_path}",
+            file_path=validated_path,
+        )
         try:
-            return file_path.read_text(encoding="utf - 8")
+            return validated_path.read_text(encoding="utf-8")
         except UnicodeDecodeError:
             for encoding in ("latin1", "cp1252"):
                 try:
-                    content = file_path.read_text(encoding=encoding)
+                    content = validated_path.read_text(encoding=encoding)
                     self.logger.warning(
-                        f"File {file_path} read with {encoding} encoding",
+                        f"File {validated_path} read with {encoding} encoding",
                     )
                     return content
                 except UnicodeDecodeError:
                     continue
+            self.security_logger.log_validation_failed(
+                "encoding",
+                file_path,
+                "Could not decode file with any supported encoding",
+            )
             raise ExecutionError(
                 message=f"Could not decode file {file_path}",
                 error_code=ErrorCode.FILE_READ_ERROR,
             )
+        except ExecutionError:
+            raise
         except Exception as e:
+            self.security_logger.log_validation_failed(
+                "file_read", file_path, f"Unexpected error during file read: {e}"
+            )
             raise ExecutionError(
                 message=f"Failed to read file {file_path}: {e}",
                 error_code=ErrorCode.FILE_READ_ERROR,
@@ -88,19 +153,42 @@ class FileProcessor(BaseModel):
     def write_file_safely(self, file_path: Path, content: str) -> None:
         try:
-            file_path.write_text(content, encoding="utf - 8")
+            AtomicFileOperations.atomic_write(file_path, content, self.base_directory)
+            self.security_logger.log_atomic_operation("write", file_path, True)
+        except ExecutionError:
+            self.security_logger.log_atomic_operation("write", file_path, False)
+            raise
         except Exception as e:
+            self.security_logger.log_atomic_operation(
+                "write", file_path, False, error=str(e)
+            )
             raise ExecutionError(
                 message=f"Failed to write file {file_path}: {e}",
                 error_code=ErrorCode.FILE_WRITE_ERROR,
             ) from e
     def backup_file(self, file_path: Path) -> Path:
-        backup_path = file_path.with_suffix(f"{file_path.suffix}.backup")
         try:
-            backup_path.write_bytes(file_path.read_bytes())
+            backup_path = AtomicFileOperations.atomic_backup_and_write(
+                file_path, file_path.read_bytes(), self.base_directory
+            )
+            self.security_logger.log_backup_created(file_path, backup_path)
             return backup_path
+        except ExecutionError:
+            raise
         except Exception as e:
+            self.security_logger.log_validation_failed(
+                "backup_creation", file_path, f"Backup creation failed: {e}"
+            )
             raise ExecutionError(
                 message=f"Failed to create backup for {file_path}: {e}",
                 error_code=ErrorCode.FILE_WRITE_ERROR,
@@ -121,7 +209,7 @@ class CleaningErrorHandler(BaseModel):
     def handle_file_error(self, file_path: Path, error: Exception, step: str) -> None:
         self.console.print(
-            f"[bold bright_yellow]⚠️ Warning: {step} failed for {file_path}: {error}[/bold bright_yellow]",
+            f"[bold bright_yellow]⚠️ Warning: {step} failed for {file_path}: {error}[/ bold bright_yellow]",
         )
         self.logger.warning(
@@ -137,18 +225,18 @@ class CleaningErrorHandler(BaseModel):
     def log_cleaning_result(self, result: CleaningResult) -> None:
         if result.success:
             self.console.print(
-                f"[green]✅ Cleaned {result.file_path}[/green] "
+                f"[green]✅ Cleaned {result.file_path}[/ green] "
                 f"({result.original_size} → {result.cleaned_size} bytes)",
             )
         else:
             self.console.print(
-                f"[red]❌ Failed to clean {result.file_path}[/red] "
+                f"[red]❌ Failed to clean {result.file_path}[/ red] "
                 f"({len(result.steps_failed)} steps failed)",
             )
         if result.warnings:
             for warning in result.warnings:
-                self.console.print(f"[yellow]⚠️ {warning}[/yellow]")
+                self.console.print(f"[yellow]⚠️ {warning}[/ yellow]")
         self.logger.info(
             "File cleaning completed",
@@ -185,7 +273,7 @@ class CleaningPipeline(BaseModel):
         self.logger.info(f"Starting clean_file for {file_path}")
         try:
             original_code = self.file_processor.read_file_safely(file_path)
-            original_size = len(original_code.encode("utf - 8"))
+            original_size = len(original_code.encode("utf-8"))
             result = self._apply_cleaning_pipeline(
                 original_code,
@@ -193,11 +281,10 @@ class CleaningPipeline(BaseModel):
                 cleaning_steps,
             )
+            cleaned_size = original_size
             if result.success and result.cleaned_code != original_code:
                 self.file_processor.write_file_safely(file_path, result.cleaned_code)
-                cleaned_size = len(result.cleaned_code.encode("utf - 8"))
-            else:
-                cleaned_size = original_size
+                cleaned_size = len(result.cleaned_code.encode("utf-8"))
             cleaning_result = CleaningResult(
                 file_path=file_path,
@@ -285,13 +372,16 @@ class CleaningPipeline(BaseModel):
 class CodeCleaner(BaseModel):
-    model_config = ConfigDict(arbitrary_types_allowed=True)
+    model_config = ConfigDict(arbitrary_types_allowed=True, extra="allow")
     console: Console
     file_processor: t.Any = None
     error_handler: t.Any = None
     pipeline: t.Any = None
     logger: t.Any = None
+    base_directory: Path | None = None
+    security_logger: t.Any = None
+    backup_service: t.Any = None
     def model_post_init(self, _: t.Any) -> None:
         if self.logger is None:
@@ -299,8 +389,13 @@ class CodeCleaner(BaseModel):
             self.logger = logging.getLogger("crackerjack.code_cleaner")
+        if self.base_directory is None:
+            self.base_directory = Path.cwd()
         if self.file_processor is None:
-            self.file_processor = FileProcessor(console=self.console)
+            self.file_processor = FileProcessor(
+                console=self.console, base_directory=self.base_directory
+            )
         if self.error_handler is None:
             self.error_handler = CleaningErrorHandler(console=self.console)
@@ -312,6 +407,12 @@ class CodeCleaner(BaseModel):
                 console=self.console,
             )
+        if self.security_logger is None:
+            self.security_logger = get_security_logger()
+        if self.backup_service is None:
+            self.backup_service = PackageBackupService()
     def clean_file(self, file_path: Path) -> CleaningResult:
         cleaning_steps = [
             self._create_line_comment_step(),
@@ -322,49 +423,655 @@ class CodeCleaner(BaseModel):
         return self.pipeline.clean_file(file_path, cleaning_steps)
-    def clean_files(self, pkg_dir: Path | None = None) -> list[CleaningResult]:
+    def clean_files(
+        self, pkg_dir: Path | None = None, use_backup: bool = True
+    ) -> list[CleaningResult] | PackageCleaningResult:
+        """Clean package files with optional backup protection.
+        Args:
+            pkg_dir: Package directory to clean (defaults to current directory)
+            use_backup: Whether to use backup protection (default: True for safety)
+        Returns:
+            PackageCleaningResult with backup protection (default), list[CleaningResult] if use_backup=False (legacy)
+        """
+        if use_backup:
+            # Use the comprehensive backup system for maximum safety
+            package_result = self.clean_files_with_backup(pkg_dir)
+            self.logger.info(
+                f"Package cleaning with backup completed: "
+                f"success={package_result.overall_success}, "
+                f"restored={package_result.backup_restored}"
+            )
+            return package_result
+        # Legacy non-backup mode (deprecated, kept for compatibility)
+        self.console.print(
+            "[yellow]⚠️ WARNING: Running without backup protection. "
+            "Consider using use_backup=True for safety.[/yellow]"
+        )
         if pkg_dir is None:
             pkg_dir = Path.cwd()
-        python_files = list(pkg_dir.rglob(" * .py"))
+        python_files = self._discover_package_files(pkg_dir)
+        files_to_process = [
+            file_path
+            for file_path in python_files
+            if self.should_process_file(file_path)
+        ]
         results: list[CleaningResult] = []
+        self.logger.info(f"Starting clean_files for {len(files_to_process)} files")
-        self.logger.info(f"Starting clean_files for {len(python_files)} files")
-        for file_path in python_files:
-            if self.should_process_file(file_path):
-                result = self.clean_file(file_path)
-                results.append(result)
+        cleaning_steps = [
+            self._create_line_comment_step(),
+            self._create_docstring_step(),
+            self._create_whitespace_step(),
+            self._create_formatting_step(),
+        ]
+        for file_path in files_to_process:
+            result = self.pipeline.clean_file(file_path, cleaning_steps)
+            results.append(result)
         return results
-    def should_process_file(self, file_path: Path) -> bool:
-        ignore_patterns = {
+    def clean_files_with_backup(
+        self, pkg_dir: Path | None = None
+    ) -> PackageCleaningResult:
+        validated_pkg_dir = self._prepare_package_directory(pkg_dir)
+        self.logger.info(
+            f"Starting safe package cleaning with backup: {validated_pkg_dir}"
+        )
+        self.console.print(
+            "[cyan]🛡️ Starting package cleaning with backup protection...[/cyan]"
+        )
+        backup_metadata: BackupMetadata | None = None
+        try:
+            backup_metadata = self._create_backup(validated_pkg_dir)
+            files_to_process = self._find_files_to_process(validated_pkg_dir)
+            if not files_to_process:
+                return self._handle_no_files_to_process(backup_metadata)
+            cleaning_result = self._execute_cleaning_with_backup(
+                files_to_process, backup_metadata
+            )
+            return self._finalize_cleaning_result(cleaning_result, backup_metadata)
+        except Exception as e:
+            return self._handle_critical_error(e, backup_metadata)
+    def _prepare_package_directory(self, pkg_dir: Path | None) -> Path:
+        if pkg_dir is None:
+            pkg_dir = Path.cwd()
+        return SecurePathValidator.validate_file_path(pkg_dir, self.base_directory)
+    def _create_backup(self, validated_pkg_dir: Path) -> BackupMetadata:
+        self.console.print(
+            "[yellow]📦 Creating backup of all package files...[/yellow]"
+        )
+        backup_metadata = self.backup_service.create_package_backup(
+            validated_pkg_dir, self.base_directory
+        )
+        self.console.print(
+            f"[green]✅ Backup created: {backup_metadata.backup_id}[/green] "
+            f"({backup_metadata.total_files} files, {backup_metadata.total_size} bytes)"
+        )
+        return backup_metadata
+    def _find_files_to_process(self, validated_pkg_dir: Path) -> list[Path]:
+        python_files = self._discover_package_files(validated_pkg_dir)
+        return [
+            file_path
+            for file_path in python_files
+            if self.should_process_file(file_path)
+        ]
+    def _discover_package_files(self, root_dir: Path) -> list[Path]:
+        """Discover Python files in the main package directory using crackerjack naming convention.
+        Crackerjack convention:
+        - Project name with dashes → package name with underscores
+        - Single word → same name lowercase
+        - Package directory determined from pyproject.toml [project.name]
+        Args:
+            root_dir: Project root directory
+        Returns:
+            List of Python files found only in the main package directory
+        """
+        package_dir = self._find_package_directory(root_dir)
+        if not package_dir or not package_dir.exists():
+            # Fallback: look for any directory with __init__.py (excluding common non-package dirs)
+            self.console.print(
+                "[yellow]⚠️ Could not determine package directory, searching for Python packages...[/yellow]"
+            )
+            return self._fallback_discover_packages(root_dir)
+        self.logger.debug(f"Using package directory: {package_dir}")
+        # Get all Python files from the package directory only
+        package_files = list(package_dir.rglob("*.py"))
+        # Filter out any problematic subdirectories that might exist within the package
+        exclude_dirs = {
+            "__pycache__",
+            ".pytest_cache",
+            ".mypy_cache",
+            ".ruff_cache",
+            ".venv",
+            "venv",
+        }
+        filtered_files = [
+            f
+            for f in package_files
+            if not any(excl in f.parts for excl in exclude_dirs)
+        ]
+        return filtered_files
+    def _find_package_directory(self, root_dir: Path) -> Path | None:
+        """Find the main package directory using crackerjack naming convention.
+        Args:
+            root_dir: Project root directory
+        Returns:
+            Path to package directory or None if not found
+        """
+        # First, try to get project name from pyproject.toml
+        pyproject_path = root_dir / "pyproject.toml"
+        if pyproject_path.exists():
+            try:
+                import tomllib
+                with pyproject_path.open("rb") as f:
+                    config = tomllib.load(f)
+                project_name = config.get("project", {}).get("name")
+                if project_name:
+                    # Apply crackerjack naming convention
+                    package_name = project_name.replace("-", "_").lower()
+                    package_dir = root_dir / package_name
+                    if package_dir.exists() and (package_dir / "__init__.py").exists():
+                        return package_dir
+            except Exception as e:
+                self.logger.debug(f"Could not parse pyproject.toml: {e}")
+        # Fallback: infer from directory name
+        package_name = root_dir.name.replace("-", "_").lower()
+        package_dir = root_dir / package_name
+        if package_dir.exists() and (package_dir / "__init__.py").exists():
+            return package_dir
+        return None
+    def _fallback_discover_packages(self, root_dir: Path) -> list[Path]:
+        """Fallback method to discover package files when convention-based detection fails."""
+        python_files = []
+        exclude_dirs = {
             "__pycache__",
             ".git",
             ".venv",
-            "site - packages",
+            "venv",
+            "site-packages",
             ".pytest_cache",
             "build",
             "dist",
+            ".tox",
+            "node_modules",
+            "tests",
+            "test",
+            "examples",
+            "example",
+            "docs",
+            "doc",
+            ".mypy_cache",
+            ".ruff_cache",
+            "htmlcov",
+            ".coverage",
         }
-        for parent in file_path.parents:
-            if parent.name in ignore_patterns:
+        for item in root_dir.iterdir():
+            if (
+                not item.is_dir()
+                or item.name.startswith(".")
+                or item.name in exclude_dirs
+            ):
+                continue
+            if (item / "__init__.py").exists():
+                package_files = [
+                    f
+                    for f in item.rglob("*.py")
+                    if self._should_include_file_path(f, exclude_dirs)
+                ]
+                python_files.extend(package_files)
+        return python_files
+    def _should_include_file_path(
+        self, file_path: Path, exclude_dirs: set[str]
+    ) -> bool:
+        """Check if a file path should be included (not in excluded directories)."""
+        # Convert path parts to set for efficient lookup
+        path_parts = set(file_path.parts)
+        # If any part of the path is in exclude_dirs, exclude it
+        return not bool(path_parts.intersection(exclude_dirs))
+    def _handle_no_files_to_process(
+        self, backup_metadata: BackupMetadata
+    ) -> PackageCleaningResult:
+        self.console.print("[yellow]⚠️ No files found to process[/yellow]")
+        self.backup_service.cleanup_backup(backup_metadata)
+        return PackageCleaningResult(
+            total_files=0,
+            successful_files=0,
+            failed_files=0,
+            file_results=[],
+            backup_metadata=None,
+            backup_restored=False,
+            overall_success=True,
+        )
+    def _execute_cleaning_with_backup(
+        self, files_to_process: list[Path], backup_metadata: BackupMetadata
+    ) -> dict[str, t.Any]:
+        self.console.print(f"[cyan]🧹 Cleaning {len(files_to_process)} files...[/cyan]")
+        cleaning_steps = [
+            self._create_line_comment_step(),
+            self._create_docstring_step(),
+            self._create_whitespace_step(),
+            self._create_formatting_step(),
+        ]
+        file_results: list[CleaningResult] = []
+        cleaning_errors: list[Exception] = []
+        for file_path in files_to_process:
+            try:
+                result = self.pipeline.clean_file(file_path, cleaning_steps)
+                result.backup_metadata = backup_metadata
+                file_results.append(result)
+                if not result.success:
+                    cleaning_errors.append(
+                        ExecutionError(
+                            message=f"Cleaning failed for {file_path}: {result.steps_failed}",
+                            error_code=ErrorCode.CODE_CLEANING_ERROR,
+                        )
+                    )
+            except Exception as e:
+                cleaning_errors.append(e)
+                file_results.append(
+                    CleaningResult(
+                        file_path=file_path,
+                        success=False,
+                        steps_completed=[],
+                        steps_failed=["file_processing"],
+                        warnings=[f"Exception during cleaning: {e}"],
+                        original_size=0,
+                        cleaned_size=0,
+                        backup_metadata=backup_metadata,
+                    )
+                )
+        return {
+            "file_results": file_results,
+            "cleaning_errors": cleaning_errors,
+            "files_to_process": files_to_process,
+        }
+    def _finalize_cleaning_result(
+        self, cleaning_result: dict[str, t.Any], backup_metadata: BackupMetadata
+    ) -> PackageCleaningResult:
+        file_results = cleaning_result["file_results"]
+        cleaning_errors = cleaning_result["cleaning_errors"]
+        files_to_process = cleaning_result["files_to_process"]
+        successful_files = sum(1 for result in file_results if result.success)
+        failed_files = len(file_results) - successful_files
+        if cleaning_errors or failed_files > 0:
+            return self._handle_cleaning_failure(
+                backup_metadata,
+                file_results,
+                files_to_process,
+                successful_files,
+                failed_files,
+                cleaning_errors,
+            )
+        return self._handle_cleaning_success(
+            backup_metadata, file_results, files_to_process, successful_files
+        )
+    def _handle_cleaning_failure(
+        self,
+        backup_metadata: BackupMetadata,
+        file_results: list[CleaningResult],
+        files_to_process: list[Path],
+        successful_files: int,
+        failed_files: int,
+        cleaning_errors: list[Exception],
+    ) -> PackageCleaningResult:
+        self.console.print(
+            f"[red]❌ Cleaning failed ({failed_files} files failed). "
+            f"Restoring from backup...[/red]"
+        )
+        self.logger.error(
+            f"Package cleaning failed with {len(cleaning_errors)} errors, "
+            f"restoring from backup {backup_metadata.backup_id}"
+        )
+        self.backup_service.restore_from_backup(backup_metadata, self.base_directory)
+        self.console.print("[green]✅ Files restored from backup successfully[/green]")
+        return PackageCleaningResult(
+            total_files=len(files_to_process),
+            successful_files=successful_files,
+            failed_files=failed_files,
+            file_results=file_results,
+            backup_metadata=backup_metadata,
+            backup_restored=True,
+            overall_success=False,
+        )
+    def _handle_cleaning_success(
+        self,
+        backup_metadata: BackupMetadata,
+        file_results: list[CleaningResult],
+        files_to_process: list[Path],
+        successful_files: int,
+    ) -> PackageCleaningResult:
+        self.console.print(
+            f"[green]✅ Package cleaning completed successfully![/green] "
+            f"({successful_files} files cleaned)"
+        )
+        self.backup_service.cleanup_backup(backup_metadata)
+        return PackageCleaningResult(
+            total_files=len(files_to_process),
+            successful_files=successful_files,
+            failed_files=0,
+            file_results=file_results,
+            backup_metadata=None,
+            backup_restored=False,
+            overall_success=True,
+        )
+    def _handle_critical_error(
+        self, error: Exception, backup_metadata: BackupMetadata | None
+    ) -> PackageCleaningResult:
+        self.logger.error(f"Critical error during package cleaning: {error}")
+        self.console.print(f"[red]💥 Critical error: {error}[/red]")
+        backup_restored = False
+        if backup_metadata:
+            backup_restored = self._attempt_emergency_restoration(backup_metadata)
+        return PackageCleaningResult(
+            total_files=0,
+            successful_files=0,
+            failed_files=0,
+            file_results=[],
+            backup_metadata=backup_metadata,
+            backup_restored=backup_restored,
+            overall_success=False,
+        )
+    def _attempt_emergency_restoration(self, backup_metadata: BackupMetadata) -> bool:
+        try:
+            self.console.print(
+                "[yellow]🔄 Attempting emergency restoration...[/yellow]"
+            )
+            self.backup_service.restore_from_backup(
+                backup_metadata, self.base_directory
+            )
+            self.console.print("[green]✅ Emergency restoration completed[/green]")
+            return True
+        except Exception as restore_error:
+            self.logger.error(f"Emergency restoration failed: {restore_error}")
+            self.console.print(
+                f"[red]💥 Emergency restoration failed: {restore_error}[/red]\n"
+                f"[yellow]⚠️ Manual restoration may be needed from: "
+                f"{backup_metadata.backup_directory}[/yellow]"
+            )
+            return False
+    def restore_from_backup_metadata(self, backup_metadata: BackupMetadata) -> None:
+        """Manually restore from backup metadata.
+        Args:
+            backup_metadata: Backup metadata containing restoration information
+        """
+        self.console.print(
+            f"[yellow]🔄 Manually restoring from backup: {backup_metadata.backup_id}[/yellow]"
+        )
+        self.backup_service.restore_from_backup(backup_metadata, self.base_directory)
+        self.console.print(
+            f"[green]✅ Manual restoration completed from backup: "
+            f"{backup_metadata.backup_id}[/green]"
+        )
+    def create_emergency_backup(self, pkg_dir: Path | None = None) -> BackupMetadata:
+        """Create an emergency backup before potentially risky operations.
+        Args:
+            pkg_dir: Package directory to backup (defaults to current directory)
+        Returns:
+            BackupMetadata for the created backup
+        """
+        validated_pkg_dir = self._prepare_package_directory(pkg_dir)
+        self.console.print(
+            "[cyan]🛡️ Creating emergency backup before risky operation...[/cyan]"
+        )
+        backup_metadata = self._create_backup(validated_pkg_dir)
+        self.console.print(
+            f"[green]✅ Emergency backup created: {backup_metadata.backup_id}[/green]"
+        )
+        return backup_metadata
+    def restore_emergency_backup(self, backup_metadata: BackupMetadata) -> bool:
+        """Restore from an emergency backup with enhanced error handling.
+        Args:
+            backup_metadata: Backup metadata for restoration
+        Returns:
+            True if restoration succeeded, False otherwise
+        """
+        try:
+            self.console.print(
+                f"[yellow]🔄 Restoring emergency backup: {backup_metadata.backup_id}[/yellow]"
+            )
+            self.backup_service.restore_from_backup(
+                backup_metadata, self.base_directory
+            )
+            self.console.print(
+                f"[green]✅ Emergency backup restored successfully: {backup_metadata.backup_id}[/green]"
+            )
+            return True
+        except Exception as e:
+            self.logger.error(f"Emergency backup restoration failed: {e}")
+            self.console.print(
+                f"[red]💥 Emergency backup restoration failed: {e}[/red]\n"
+                f"[yellow]⚠️ Manual intervention required. Backup location: "
+                f"{backup_metadata.backup_directory}[/yellow]"
+            )
+            return False
+    def verify_backup_integrity(self, backup_metadata: BackupMetadata) -> bool:
+        """Verify the integrity of a backup without restoring it.
+        Args:
+            backup_metadata: Backup metadata to verify
+        Returns:
+            True if backup is valid and can be restored, False otherwise
+        """
+        try:
+            validation_result = self.backup_service._validate_backup(backup_metadata)
+            if validation_result.is_valid:
+                self.console.print(
+                    f"[green]✅ Backup verification passed: {backup_metadata.backup_id}[/green] "
+                    f"({validation_result.total_validated} files verified)"
+                )
+                return True
+            else:
+                self.console.print(
+                    f"[red]❌ Backup verification failed: {backup_metadata.backup_id}[/red]"
+                )
+                for error in validation_result.validation_errors[
+                    :3
+                ]:  # Show first 3 errors
+                    self.console.print(f"[red]  • {error}[/red]")
+                if len(validation_result.validation_errors) > 3:
+                    remaining = len(validation_result.validation_errors) - 3
+                    self.console.print(f"[red]  ... and {remaining} more errors[/red]")
                 return False
-        return not (file_path.name.startswith(".") or file_path.suffix != ".py")
+        except Exception as e:
+            self.logger.error(f"Backup verification failed with exception: {e}")
+            self.console.print(f"[red]💥 Backup verification error: {e}[/red]")
+            return False
+    def list_available_backups(self) -> list[Path]:
+        """List all available backup directories.
+        Returns:
+            List of backup directory paths
+        """
+        if (
+            not self.backup_service.backup_root
+            or not self.backup_service.backup_root.exists()
+        ):
+            self.console.print("[yellow]⚠️ No backup root directory found[/yellow]")
+            return []
+        try:
+            backup_dirs = [
+                path
+                for path in self.backup_service.backup_root.iterdir()
+                if path.is_dir() and path.name.startswith("backup_")
+            ]
+            if backup_dirs:
+                self.console.print(
+                    f"[cyan]📦 Found {len(backup_dirs)} available backups:[/cyan]"
+                )
+                for backup_dir in sorted(backup_dirs):
+                    self.console.print(f"  • {backup_dir.name}")
+            else:
+                self.console.print("[yellow]⚠️ No backups found[/yellow]")
+            return backup_dirs
+        except Exception as e:
+            self.logger.error(f"Failed to list backups: {e}")
+            self.console.print(f"[red]💥 Error listing backups: {e}[/red]")
+            return []
+    def should_process_file(self, file_path: Path) -> bool:
+        try:
+            validated_path = SecurePathValidator.validate_file_path(
+                file_path, self.base_directory
+            )
+            SecurePathValidator.validate_file_size(validated_path)
+            ignore_patterns = {
+                "__pycache__",
+                ".git",
+                ".venv",
+                "site-packages",
+                ".pytest_cache",
+                "build",
+                "dist",
+                "tests",
+                "test",
+                "examples",
+                "example",
+            }
+            for parent in validated_path.parents:
+                if parent.name in ignore_patterns:
+                    return False
+            should_process = not (
+                validated_path.name.startswith(".") or validated_path.suffix != ".py"
+            )
+            if should_process:
+                self.security_logger.log_security_event(
+                    SecurityEventType.FILE_CLEANED,
+                    SecurityEventLevel.LOW,
+                    f"File approved for processing: {validated_path}",
+                    file_path=validated_path,
+                )
+            return should_process
+        except ExecutionError as e:
+            self.security_logger.log_validation_failed(
+                "file_processing_check",
+                file_path,
+                f"File failed security validation: {e}",
+            )
+            return False
+        except Exception as e:
+            self.logger.warning(f"Unexpected error checking file {file_path}: {e}")
+            return False
     def _create_line_comment_step(self) -> CleaningStepProtocol:
-        """Create a step for removing line comments while preserving special comments."""
         return self._LineCommentStep()
     def _create_docstring_step(self) -> CleaningStepProtocol:
-        """Create a step for removing docstrings."""
         return self._DocstringStep()
     class _DocstringStep:
-        """Step implementation for removing docstrings."""
         name = "remove_docstrings"
         def _is_docstring_node(self, node: ast.AST) -> bool:
@@ -426,10 +1133,10 @@ class CodeCleaner(BaseModel):
             lines_to_remove: set[int] = set()
             for node in docstring_nodes:
-                # Most AST nodes have lineno and end_lineno attributes
                 start_line = getattr(node, "lineno", 1)
-                end_line = getattr(node, "end_lineno", start_line + 1)
-                lines_to_remove.update(range(start_line, end_line))
+                end_line = getattr(node, "end_lineno", start_line)
+                lines_to_remove.update(range(start_line, end_line + 1))
             result_lines = [
                 line for i, line in enumerate(lines, 1) if i not in lines_to_remove
@@ -439,95 +1146,58 @@ class CodeCleaner(BaseModel):
             return self._regex_fallback_removal(result)
         def _regex_fallback_removal(self, code: str) -> str:
-            import re
-            patterns = [
-                r'^\s*""".*?"""\s*$',
-                r"^\s*'''.*?'''\s*$",
-                r'^\s*""".*?"""\s*$',
-                r"^\s*'''.*?'''\s*$",
-            ]
-            result = code
-            for pattern in patterns:
-                result = re.sub(pattern, "", result, flags=re.MULTILINE | re.DOTALL)
-            return result
+            return _safe_applicator.apply_docstring_patterns(code)
     class _LineCommentStep:
-        """Step implementation for removing line comments."""
         name = "remove_line_comments"
         def __call__(self, code: str, file_path: Path) -> str:
             lines = code.split("\n")
-            # Performance: Use list comprehension instead of generator for small-to-medium files
             processed_lines = [self._process_line_for_comments(line) for line in lines]
             return "\n".join(processed_lines)
         def _process_line_for_comments(self, line: str) -> str:
-            """Process a single line to remove comments while preserving strings."""
             if not line.strip() or self._is_preserved_comment_line(line):
                 return line
             return self._remove_comment_from_line(line)
         def _is_preserved_comment_line(self, line: str) -> bool:
-            """Check if this comment line should be preserved."""
             stripped = line.strip()
             if not stripped.startswith("#"):
                 return False
             return self._has_preserved_pattern(stripped)
         def _has_preserved_pattern(self, stripped_line: str) -> bool:
-            """Check if line contains preserved comment patterns."""
-            preserved_patterns = ["coding: ", "encoding: ", "type: ", "noqa", "pragma"]
-            return stripped_line.startswith("# !/ ") or any(
-                pattern in stripped_line for pattern in preserved_patterns
-            )
+            return _safe_applicator.has_preserved_comment(stripped_line)
         def _remove_comment_from_line(self, line: str) -> str:
-            """Remove comments from a line while preserving string literals."""
-            result: list[str] = []
-            string_state: dict[str, t.Any] = {"in_string": False, "quote_char": None}
-            for i, char in enumerate(line):
-                if self._should_break_at_comment(char, string_state):
-                    break
-                self._update_string_state(char, i, line, string_state)
-                result.append(char)
-            return "".join(result).rstrip()
-        def _should_break_at_comment(self, char: str, state: dict[str, t.Any]) -> bool:
-            """Check if we should break at a comment character."""
-            return not state["in_string"] and char == "#"
-        def _update_string_state(
-            self,
-            char: str,
-            index: int,
-            line: str,
-            state: dict[str, t.Any],
-        ) -> None:
-            """Update string parsing state based on current character."""
-            if self._is_string_start(char, state):
-                state["in_string"], state["quote_char"] = True, char
-            elif self._is_string_end(char, index, line, state):
-                state["in_string"], state["quote_char"] = False, None
-        def _is_string_start(self, char: str, state: dict[str, t.Any]) -> bool:
-            """Check if character starts a string."""
-            return not state["in_string"] and char in ('"', "'")
-        def _is_string_end(
-            self,
-            char: str,
-            index: int,
-            line: str,
-            state: dict[str, t.Any],
-        ) -> bool:
-            """Check if character ends a string."""
-            return (
-                state["in_string"]
-                and char == state["quote_char"]
-                and (index == 0 or line[index - 1] != "\\")
-            )
+            if '"' not in line and "'" not in line and "#" not in line:
+                return line
+            result_chars = []
+            in_string = False
+            quote_char = None
+            i = 0
+            length = len(line)
+            while i < length:
+                char = line[i]
+                if not in_string:
+                    if char == "#":
+                        break
+                    elif char in ('"', "'"):
+                        in_string = True
+                        quote_char = char
+                elif char == quote_char and (i == 0 or line[i - 1] != "\\"):
+                    in_string = False
+                    quote_char = None
+                result_chars.append(char)
+                i += 1
+            return "".join(result_chars).rstrip()
     def _create_docstring_finder_class(
         self,
@@ -570,11 +1240,8 @@ class CodeCleaner(BaseModel):
             name = "remove_extra_whitespace"
             def __call__(self, code: str, file_path: Path) -> str:
-                import re
                 lines = code.split("\n")
                 cleaned_lines: list[str] = []
                 empty_line_count = 0
                 for line in lines:
@@ -586,13 +1253,13 @@ class CodeCleaner(BaseModel):
                             cleaned_lines.append("")
                     else:
                         empty_line_count = 0
                         leading_whitespace = len(cleaned_line) - len(
-                            cleaned_line.lstrip(),
+                            cleaned_line.lstrip()
                         )
                         content = cleaned_line.lstrip()
-                        content = re.sub(r" {2, }", " ", content)
+                        # Use SAFE_PATTERNS for multiple spaces replacement
+                        content = SAFE_PATTERNS["multiple_spaces"].apply(content)
                         cleaned_line = cleaned_line[:leading_whitespace] + content
                         cleaned_lines.append(cleaned_line)
@@ -612,33 +1279,26 @@ class CodeCleaner(BaseModel):
         class FormattingStep:
             name = "format_code"
-            def __call__(self, code: str, file_path: Path) -> str:
-                import re
+            def _is_preserved_comment_line(self, line: str) -> bool:
+                stripped = line.strip()
+                if not stripped.startswith("#"):
+                    return False
+                return _safe_applicator.has_preserved_comment(line)
+            def __call__(self, code: str, file_path: Path) -> str:
                 lines = code.split("\n")
                 formatted_lines: list[str] = []
                 for line in lines:
                     if line.strip():
+                        if self._is_preserved_comment_line(line):
+                            formatted_lines.append(line)
+                            continue
                         leading_whitespace = len(line) - len(line.lstrip())
                         content = line.lstrip()
-                        content = re.sub(
-                            r"([ =+ \ -*/%<>!&|^ ])([ ^ =+ \ -*/%<>!&|^ ])",
-                            r"\1 \2",
-                            content,
-                        )
-                        content = re.sub(
-                            r"([ ^ =+ \ -*/%<>!&|^ ])([ =+ \ -*/%<>!&|^ ])",
-                            r"\1 \2",
-                            content,
-                        )
-                        content = re.sub(r", ([ ^ \n])", r", \1", content)
-                        content = re.sub(r": ([ ^ \n: ])", r": \1", content)
-                        content = re.sub(r" {2, }", " ", content)
+                        content = _safe_applicator.apply_formatting_patterns(content)
                         formatted_line = line[:leading_whitespace] + content
                         formatted_lines.append(formatted_line)

crackerjack 0.31.10__py3-none-any.whl → 0.31.12__py3-none-any.whl

Potentially problematic release.

crackerjack 0.31.10py3-none-any.whl → 0.31.12py3-none-any.whl