PyPI - fraiseql-confiture - Versions diffs - 0.3.7__cp311-cp311-macosx_11_0_arm64.whl - Mend

fraiseql-confiture 0.3.7__cp311-cp311-macosx_11_0_arm64.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (124) hide show

confiture/__init__.py +48 -0
confiture/_core.cpython-311-darwin.so +0 -0
confiture/cli/__init__.py +0 -0
confiture/cli/dry_run.py +116 -0
confiture/cli/lint_formatter.py +193 -0
confiture/cli/main.py +1893 -0
confiture/config/__init__.py +0 -0
confiture/config/environment.py +263 -0
confiture/core/__init__.py +51 -0
confiture/core/anonymization/__init__.py +0 -0
confiture/core/anonymization/audit.py +485 -0
confiture/core/anonymization/benchmarking.py +372 -0
confiture/core/anonymization/breach_notification.py +652 -0
confiture/core/anonymization/compliance.py +617 -0
confiture/core/anonymization/composer.py +298 -0
confiture/core/anonymization/data_subject_rights.py +669 -0
confiture/core/anonymization/factory.py +319 -0
confiture/core/anonymization/governance.py +737 -0
confiture/core/anonymization/performance.py +1092 -0
confiture/core/anonymization/profile.py +284 -0
confiture/core/anonymization/registry.py +195 -0
confiture/core/anonymization/security/kms_manager.py +547 -0
confiture/core/anonymization/security/lineage.py +888 -0
confiture/core/anonymization/security/token_store.py +686 -0
confiture/core/anonymization/strategies/__init__.py +41 -0
confiture/core/anonymization/strategies/address.py +359 -0
confiture/core/anonymization/strategies/credit_card.py +374 -0
confiture/core/anonymization/strategies/custom.py +161 -0
confiture/core/anonymization/strategies/date.py +218 -0
confiture/core/anonymization/strategies/differential_privacy.py +398 -0
confiture/core/anonymization/strategies/email.py +141 -0
confiture/core/anonymization/strategies/format_preserving_encryption.py +310 -0
confiture/core/anonymization/strategies/hash.py +150 -0
confiture/core/anonymization/strategies/ip_address.py +235 -0
confiture/core/anonymization/strategies/masking_retention.py +252 -0
confiture/core/anonymization/strategies/name.py +298 -0
confiture/core/anonymization/strategies/phone.py +119 -0
confiture/core/anonymization/strategies/preserve.py +85 -0
confiture/core/anonymization/strategies/redact.py +101 -0
confiture/core/anonymization/strategies/salted_hashing.py +322 -0
confiture/core/anonymization/strategies/text_redaction.py +183 -0
confiture/core/anonymization/strategies/tokenization.py +334 -0
confiture/core/anonymization/strategy.py +241 -0
confiture/core/anonymization/syncer_audit.py +357 -0
confiture/core/blue_green.py +683 -0
confiture/core/builder.py +500 -0
confiture/core/checksum.py +358 -0
confiture/core/connection.py +184 -0
confiture/core/differ.py +522 -0
confiture/core/drift.py +564 -0
confiture/core/dry_run.py +182 -0
confiture/core/health.py +313 -0
confiture/core/hooks/__init__.py +87 -0
confiture/core/hooks/base.py +232 -0
confiture/core/hooks/context.py +146 -0
confiture/core/hooks/execution_strategies.py +57 -0
confiture/core/hooks/observability.py +220 -0
confiture/core/hooks/phases.py +53 -0
confiture/core/hooks/registry.py +295 -0
confiture/core/large_tables.py +775 -0
confiture/core/linting/__init__.py +70 -0
confiture/core/linting/composer.py +192 -0
confiture/core/linting/libraries/__init__.py +17 -0
confiture/core/linting/libraries/gdpr.py +168 -0
confiture/core/linting/libraries/general.py +184 -0
confiture/core/linting/libraries/hipaa.py +144 -0
confiture/core/linting/libraries/pci_dss.py +104 -0
confiture/core/linting/libraries/sox.py +120 -0
confiture/core/linting/schema_linter.py +491 -0
confiture/core/linting/versioning.py +151 -0
confiture/core/locking.py +389 -0
confiture/core/migration_generator.py +298 -0
confiture/core/migrator.py +882 -0
confiture/core/observability/__init__.py +44 -0
confiture/core/observability/audit.py +323 -0
confiture/core/observability/logging.py +187 -0
confiture/core/observability/metrics.py +174 -0
confiture/core/observability/tracing.py +192 -0
confiture/core/pg_version.py +418 -0
confiture/core/pool.py +406 -0
confiture/core/risk/__init__.py +39 -0
confiture/core/risk/predictor.py +188 -0
confiture/core/risk/scoring.py +248 -0
confiture/core/rollback_generator.py +388 -0
confiture/core/schema_analyzer.py +769 -0
confiture/core/schema_to_schema.py +590 -0
confiture/core/security/__init__.py +32 -0
confiture/core/security/logging.py +201 -0
confiture/core/security/validation.py +416 -0
confiture/core/signals.py +371 -0
confiture/core/syncer.py +540 -0
confiture/exceptions.py +192 -0
confiture/integrations/__init__.py +0 -0
confiture/models/__init__.py +24 -0
confiture/models/lint.py +193 -0
confiture/models/migration.py +265 -0
confiture/models/schema.py +203 -0
confiture/models/sql_file_migration.py +225 -0
confiture/scenarios/__init__.py +36 -0
confiture/scenarios/compliance.py +586 -0
confiture/scenarios/ecommerce.py +199 -0
confiture/scenarios/financial.py +253 -0
confiture/scenarios/healthcare.py +315 -0
confiture/scenarios/multi_tenant.py +340 -0
confiture/scenarios/saas.py +295 -0
confiture/testing/FRAMEWORK_API.md +722 -0
confiture/testing/__init__.py +100 -0
confiture/testing/fixtures/__init__.py +11 -0
confiture/testing/fixtures/data_validator.py +229 -0
confiture/testing/fixtures/migration_runner.py +167 -0
confiture/testing/fixtures/schema_snapshotter.py +352 -0
confiture/testing/frameworks/__init__.py +10 -0
confiture/testing/frameworks/mutation.py +587 -0
confiture/testing/frameworks/performance.py +479 -0
confiture/testing/loader.py +225 -0
confiture/testing/pytest/__init__.py +38 -0
confiture/testing/pytest_plugin.py +190 -0
confiture/testing/sandbox.py +304 -0
confiture/testing/utils/__init__.py +0 -0
fraiseql_confiture-0.3.7.dist-info/METADATA +438 -0
fraiseql_confiture-0.3.7.dist-info/RECORD +124 -0
fraiseql_confiture-0.3.7.dist-info/WHEEL +4 -0
fraiseql_confiture-0.3.7.dist-info/entry_points.txt +4 -0
fraiseql_confiture-0.3.7.dist-info/licenses/LICENSE +21 -0

confiture/core/drift.py ADDED Viewed

@@ -0,0 +1,564 @@
+"""Schema drift detection for Confiture.
+Compares live database schema against expected state from migrations
+to detect unauthorized changes or migration mishaps.
+"""
+import logging
+import time
+from dataclasses import dataclass, field
+from enum import Enum
+from typing import Any
+import psycopg
+from confiture.core.schema_analyzer import SchemaAnalyzer, SchemaInfo
+logger = logging.getLogger(__name__)
+class DriftType(Enum):
+    """Types of schema drift."""
+    MISSING_TABLE = "missing_table"
+    EXTRA_TABLE = "extra_table"
+    MISSING_COLUMN = "missing_column"
+    EXTRA_COLUMN = "extra_column"
+    TYPE_MISMATCH = "type_mismatch"
+    NULLABLE_MISMATCH = "nullable_mismatch"
+    DEFAULT_MISMATCH = "default_mismatch"
+    MISSING_INDEX = "missing_index"
+    EXTRA_INDEX = "extra_index"
+    MISSING_CONSTRAINT = "missing_constraint"
+    EXTRA_CONSTRAINT = "extra_constraint"
+class DriftSeverity(Enum):
+    """Severity of drift."""
+    CRITICAL = "critical"  # Missing table/column
+    WARNING = "warning"  # Extra objects, type changes
+    INFO = "info"  # Minor differences
+@dataclass
+class DriftItem:
+    """A single drift item."""
+    drift_type: DriftType
+    severity: DriftSeverity
+    object_name: str
+    expected: Any = None
+    actual: Any = None
+    message: str = ""
+    def __str__(self) -> str:
+        return f"[{self.severity.value}] {self.drift_type.value}: {self.message}"
+    def to_dict(self) -> dict[str, Any]:
+        """Convert to dictionary for JSON serialization."""
+        return {
+            "type": self.drift_type.value,
+            "severity": self.severity.value,
+            "object": self.object_name,
+            "expected": str(self.expected) if self.expected is not None else None,
+            "actual": str(self.actual) if self.actual is not None else None,
+            "message": self.message,
+        }
+@dataclass
+class DriftReport:
+    """Report of schema drift detection."""
+    database_name: str
+    expected_schema_source: str  # "migrations" or file path
+    drift_items: list[DriftItem] = field(default_factory=list)
+    tables_checked: int = 0
+    columns_checked: int = 0
+    indexes_checked: int = 0
+    detection_time_ms: int = 0
+    @property
+    def has_drift(self) -> bool:
+        """Check if any drift was detected."""
+        return len(self.drift_items) > 0
+    @property
+    def has_critical_drift(self) -> bool:
+        """Check if any critical drift was detected."""
+        return any(d.severity == DriftSeverity.CRITICAL for d in self.drift_items)
+    @property
+    def critical_count(self) -> int:
+        """Count of critical drift items."""
+        return sum(1 for d in self.drift_items if d.severity == DriftSeverity.CRITICAL)
+    @property
+    def warning_count(self) -> int:
+        """Count of warning drift items."""
+        return sum(1 for d in self.drift_items if d.severity == DriftSeverity.WARNING)
+    @property
+    def info_count(self) -> int:
+        """Count of info drift items."""
+        return sum(1 for d in self.drift_items if d.severity == DriftSeverity.INFO)
+    def to_dict(self) -> dict[str, Any]:
+        """Convert to dictionary for JSON serialization."""
+        return {
+            "database_name": self.database_name,
+            "expected_schema_source": self.expected_schema_source,
+            "has_drift": self.has_drift,
+            "has_critical_drift": self.has_critical_drift,
+            "critical_count": self.critical_count,
+            "warning_count": self.warning_count,
+            "info_count": self.info_count,
+            "tables_checked": self.tables_checked,
+            "columns_checked": self.columns_checked,
+            "indexes_checked": self.indexes_checked,
+            "detection_time_ms": self.detection_time_ms,
+            "drift_items": [d.to_dict() for d in self.drift_items],
+        }
+class SchemaDriftDetector:
+    """Detects schema drift between live database and expected state.
+    Compares live database schema against expected state to find:
+    - Missing/extra tables
+    - Missing/extra columns
+    - Type mismatches
+    - Nullable mismatches
+    - Missing/extra indexes
+    Example:
+        >>> detector = SchemaDriftDetector(conn)
+        >>> report = detector.compare_with_expected(expected_schema)
+        >>> if report.has_critical_drift:
+        ...     print("CRITICAL: Schema has drifted!")
+        ...     for item in report.drift_items:
+        ...         print(f"  {item}")
+    """
+    # Tables to always ignore
+    SYSTEM_TABLES = {
+        "confiture_migrations",
+        "confiture_version",
+        "confiture_audit_log",
+    }
+    def __init__(
+        self,
+        connection: psycopg.Connection,
+        ignore_tables: list[str] | None = None,
+    ):
+        """Initialize drift detector.
+        Args:
+            connection: Database connection
+            ignore_tables: Additional tables to ignore in drift detection
+        """
+        self.connection = connection
+        self.analyzer = SchemaAnalyzer(connection)
+        self.ignore_tables = set(ignore_tables or [])
+        # Always ignore Confiture's own tables
+        self.ignore_tables.update(self.SYSTEM_TABLES)
+    def compare_schemas(
+        self,
+        expected: SchemaInfo,
+        actual: SchemaInfo,
+    ) -> DriftReport:
+        """Compare two schema info objects.
+        Args:
+            expected: Expected schema state
+            actual: Actual (live) schema state
+        Returns:
+            DriftReport with differences
+        """
+        start_time = time.perf_counter()
+        report = DriftReport(
+            database_name=self._get_database_name(),
+            expected_schema_source="provided",
+        )
+        # Compare tables
+        expected_tables = set(expected.tables.keys()) - self.ignore_tables
+        actual_tables = set(actual.tables.keys()) - self.ignore_tables
+        # Missing tables (in expected but not actual)
+        for table in sorted(expected_tables - actual_tables):
+            report.drift_items.append(
+                DriftItem(
+                    drift_type=DriftType.MISSING_TABLE,
+                    severity=DriftSeverity.CRITICAL,
+                    object_name=table,
+                    expected=table,
+                    actual=None,
+                    message=f"Table '{table}' is missing from database",
+                )
+            )
+        # Extra tables (in actual but not expected)
+        for table in sorted(actual_tables - expected_tables):
+            report.drift_items.append(
+                DriftItem(
+                    drift_type=DriftType.EXTRA_TABLE,
+                    severity=DriftSeverity.WARNING,
+                    object_name=table,
+                    expected=None,
+                    actual=table,
+                    message=f"Table '{table}' exists but is not in expected schema",
+                )
+            )
+        # Compare columns for tables that exist in both
+        for table in sorted(expected_tables & actual_tables):
+            report.tables_checked += 1
+            self._compare_table_columns(
+                table,
+                expected.tables[table],
+                actual.tables[table],
+                report,
+            )
+        # Compare indexes
+        self._compare_indexes(expected, actual, report)
+        report.detection_time_ms = int((time.perf_counter() - start_time) * 1000)
+        return report
+    def _compare_table_columns(
+        self,
+        table_name: str,
+        expected_cols: dict[str, dict],
+        actual_cols: dict[str, dict],
+        report: DriftReport,
+    ) -> None:
+        """Compare columns for a single table."""
+        expected_col_names = set(expected_cols.keys())
+        actual_col_names = set(actual_cols.keys())
+        # Missing columns
+        for col in sorted(expected_col_names - actual_col_names):
+            report.drift_items.append(
+                DriftItem(
+                    drift_type=DriftType.MISSING_COLUMN,
+                    severity=DriftSeverity.CRITICAL,
+                    object_name=f"{table_name}.{col}",
+                    expected=expected_cols[col],
+                    actual=None,
+                    message=f"Column '{table_name}.{col}' is missing",
+                )
+            )
+        # Extra columns
+        for col in sorted(actual_col_names - expected_col_names):
+            report.drift_items.append(
+                DriftItem(
+                    drift_type=DriftType.EXTRA_COLUMN,
+                    severity=DriftSeverity.WARNING,
+                    object_name=f"{table_name}.{col}",
+                    expected=None,
+                    actual=actual_cols[col],
+                    message=f"Column '{table_name}.{col}' exists but is not expected",
+                )
+            )
+        # Compare matching columns
+        for col in sorted(expected_col_names & actual_col_names):
+            report.columns_checked += 1
+            exp = expected_cols[col]
+            act = actual_cols[col]
+            # Type mismatch
+            exp_type = exp.get("type", "").lower()
+            act_type = act.get("type", "").lower()
+            # Check for compatible types (e.g., integer vs int4)
+            if (
+                exp_type
+                and act_type
+                and exp_type != act_type
+                and not self._types_compatible(exp_type, act_type)
+            ):
+                report.drift_items.append(
+                    DriftItem(
+                        drift_type=DriftType.TYPE_MISMATCH,
+                        severity=DriftSeverity.WARNING,
+                        object_name=f"{table_name}.{col}",
+                        expected=exp_type,
+                        actual=act_type,
+                        message=f"Column '{table_name}.{col}' type mismatch: "
+                        f"expected {exp_type}, got {act_type}",
+                    )
+                )
+            # Nullable mismatch
+            exp_nullable = exp.get("nullable")
+            act_nullable = act.get("nullable")
+            if (
+                exp_nullable is not None
+                and act_nullable is not None
+                and exp_nullable != act_nullable
+            ):
+                report.drift_items.append(
+                    DriftItem(
+                        drift_type=DriftType.NULLABLE_MISMATCH,
+                        severity=DriftSeverity.WARNING,
+                        object_name=f"{table_name}.{col}",
+                        expected=f"nullable={exp_nullable}",
+                        actual=f"nullable={act_nullable}",
+                        message=f"Column '{table_name}.{col}' nullable mismatch: "
+                        f"expected {exp_nullable}, got {act_nullable}",
+                    )
+                )
+    def _types_compatible(self, type1: str, type2: str) -> bool:
+        """Check if two PostgreSQL types are compatible/equivalent."""
+        # Normalize type names
+        type_aliases = {
+            "integer": "int4",
+            "int": "int4",
+            "bigint": "int8",
+            "smallint": "int2",
+            "boolean": "bool",
+            "character varying": "varchar",
+            "character": "char",
+            "double precision": "float8",
+            "real": "float4",
+            "timestamp without time zone": "timestamp",
+            "timestamp with time zone": "timestamptz",
+        }
+        t1 = type_aliases.get(type1.lower(), type1.lower())
+        t2 = type_aliases.get(type2.lower(), type2.lower())
+        return t1 == t2
+    def _compare_indexes(
+        self,
+        expected: SchemaInfo,
+        actual: SchemaInfo,
+        report: DriftReport,
+    ) -> None:
+        """Compare indexes between schemas."""
+        for table in expected.indexes:
+            if table in self.ignore_tables:
+                continue
+            exp_indexes = set(expected.indexes.get(table, []))
+            act_indexes = set(actual.indexes.get(table, []))
+            # Missing indexes
+            for idx in sorted(exp_indexes - act_indexes):
+                report.indexes_checked += 1
+                report.drift_items.append(
+                    DriftItem(
+                        drift_type=DriftType.MISSING_INDEX,
+                        severity=DriftSeverity.WARNING,
+                        object_name=f"{table}.{idx}",
+                        expected=idx,
+                        actual=None,
+                        message=f"Index '{idx}' on '{table}' is missing",
+                    )
+                )
+            # Extra indexes
+            for idx in sorted(act_indexes - exp_indexes):
+                report.indexes_checked += 1
+                report.drift_items.append(
+                    DriftItem(
+                        drift_type=DriftType.EXTRA_INDEX,
+                        severity=DriftSeverity.INFO,
+                        object_name=f"{table}.{idx}",
+                        expected=None,
+                        actual=idx,
+                        message=f"Index '{idx}' on '{table}' exists but is not expected",
+                    )
+                )
+    def get_live_schema(self) -> SchemaInfo:
+        """Get the current live database schema.
+        Returns:
+            SchemaInfo with current database state
+        """
+        return self.analyzer.get_schema_info(refresh=True)
+    def compare_with_expected(self, expected: SchemaInfo) -> DriftReport:
+        """Compare live database with expected schema.
+        Args:
+            expected: Expected schema state
+        Returns:
+            DriftReport with differences
+        """
+        actual = self.get_live_schema()
+        report = self.compare_schemas(expected, actual)
+        report.expected_schema_source = "provided"
+        return report
+    def compare_with_schema_file(self, schema_file_path: str) -> DriftReport:
+        """Compare live database with a schema SQL file.
+        This parses a SQL schema file to extract expected schema.
+        Args:
+            schema_file_path: Path to schema SQL file
+        Returns:
+            DriftReport with differences
+        """
+        from pathlib import Path
+        path = Path(schema_file_path)
+        if not path.exists():
+            raise FileNotFoundError(f"Schema file not found: {schema_file_path}")
+        sql_content = path.read_text()
+        expected = self._parse_schema_from_sql(sql_content)
+        actual = self.get_live_schema()
+        report = self.compare_schemas(expected, actual)
+        report.expected_schema_source = f"file:{schema_file_path}"
+        return report
+    def _parse_schema_from_sql(self, sql: str) -> SchemaInfo:
+        """Parse SQL DDL to extract schema information.
+        This is a simplified parser that extracts table and column info
+        from CREATE TABLE statements.
+        Args:
+            sql: SQL DDL statements
+        Returns:
+            SchemaInfo extracted from SQL
+        """
+        import re
+        import sqlparse
+        info = SchemaInfo()
+        # Parse CREATE TABLE statements
+        statements = sqlparse.parse(sql)
+        for stmt in statements:
+            stmt_str = str(stmt).strip()
+            if not stmt_str:
+                continue
+            # Check for CREATE TABLE
+            match = re.match(
+                r"CREATE\s+TABLE\s+(?:IF\s+NOT\s+EXISTS\s+)?(?:\")?(\w+)(?:\")?",
+                stmt_str,
+                re.IGNORECASE,
+            )
+            if match:
+                table_name = match.group(1).lower()
+                columns = self._extract_columns_from_create(stmt_str)
+                info.tables[table_name] = columns
+            # Check for CREATE INDEX
+            match = re.match(
+                r"CREATE\s+(?:UNIQUE\s+)?INDEX\s+(?:CONCURRENTLY\s+)?"
+                r"(?:IF\s+NOT\s+EXISTS\s+)?(?:\")?(\w+)(?:\")?\s+ON\s+(?:\")?(\w+)(?:\")?",
+                stmt_str,
+                re.IGNORECASE,
+            )
+            if match:
+                index_name = match.group(1).lower()
+                table_name = match.group(2).lower()
+                if table_name not in info.indexes:
+                    info.indexes[table_name] = []
+                info.indexes[table_name].append(index_name)
+        return info
+    def _extract_columns_from_create(self, create_stmt: str) -> dict[str, dict]:
+        """Extract column definitions from CREATE TABLE statement."""
+        import re
+        columns: dict[str, dict] = {}
+        # Find the column definitions between parentheses
+        match = re.search(r"\((.*)\)", create_stmt, re.DOTALL)
+        if not match:
+            return columns
+        definitions = match.group(1)
+        # Split by comma, but be careful about nested parentheses
+        parts = self._split_column_definitions(definitions)
+        for part in parts:
+            part = part.strip()
+            if not part:
+                continue
+            upper_part = part.upper()
+            # Skip table-level constraints (start with constraint keywords)
+            # But NOT column definitions that happen to have PRIMARY KEY inline
+            constraint_starters = [
+                "PRIMARY KEY",
+                "FOREIGN KEY",
+                "UNIQUE",
+                "CHECK",
+                "CONSTRAINT",
+            ]
+            if any(upper_part.startswith(kw) for kw in constraint_starters):
+                continue
+            # Parse column definition
+            col_match = re.match(r"(?:\")?(\w+)(?:\")?\s+(\w+(?:\([^)]*\))?)", part)
+            if col_match:
+                col_name = col_match.group(1).lower()
+                col_type = col_match.group(2).lower()
+                # Check for NOT NULL (PRIMARY KEY implies NOT NULL)
+                nullable = "NOT NULL" not in upper_part and "PRIMARY KEY" not in upper_part
+                columns[col_name] = {
+                    "type": col_type,
+                    "nullable": nullable,
+                    "default": None,
+                }
+        return columns
+    def _split_column_definitions(self, definitions: str) -> list[str]:
+        """Split column definitions respecting parentheses."""
+        parts = []
+        current = []
+        depth = 0
+        for char in definitions:
+            if char == "(":
+                depth += 1
+                current.append(char)
+            elif char == ")":
+                depth -= 1
+                current.append(char)
+            elif char == "," and depth == 0:
+                parts.append("".join(current))
+                current = []
+            else:
+                current.append(char)
+        if current:
+            parts.append("".join(current))
+        return parts
+    def _get_database_name(self) -> str:
+        """Get current database name."""
+        with self.connection.cursor() as cur:
+            cur.execute("SELECT current_database()")
+            result = cur.fetchone()
+            return result[0] if result else "unknown"