PyPI - sqlspec - Versions diffs - 0.11.0__py3-none-any.whl → 0.12.0__py3-none-any.whl - Mend

sqlspec 0.11.0py3-none-any.whl → 0.12.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of sqlspec might be problematic. Click here for more details.

Files changed (155) hide show

sqlspec/__init__.py +16 -3
sqlspec/_serialization.py +3 -10
sqlspec/_sql.py +1147 -0
sqlspec/_typing.py +343 -41
sqlspec/adapters/adbc/__init__.py +2 -6
sqlspec/adapters/adbc/config.py +474 -149
sqlspec/adapters/adbc/driver.py +330 -644
sqlspec/adapters/aiosqlite/__init__.py +2 -6
sqlspec/adapters/aiosqlite/config.py +143 -57
sqlspec/adapters/aiosqlite/driver.py +269 -462
sqlspec/adapters/asyncmy/__init__.py +3 -8
sqlspec/adapters/asyncmy/config.py +247 -202
sqlspec/adapters/asyncmy/driver.py +217 -451
sqlspec/adapters/asyncpg/__init__.py +4 -7
sqlspec/adapters/asyncpg/config.py +329 -176
sqlspec/adapters/asyncpg/driver.py +418 -498
sqlspec/adapters/bigquery/__init__.py +2 -2
sqlspec/adapters/bigquery/config.py +407 -0
sqlspec/adapters/bigquery/driver.py +592 -634
sqlspec/adapters/duckdb/__init__.py +4 -1
sqlspec/adapters/duckdb/config.py +432 -321
sqlspec/adapters/duckdb/driver.py +393 -436
sqlspec/adapters/oracledb/__init__.py +3 -8
sqlspec/adapters/oracledb/config.py +625 -0
sqlspec/adapters/oracledb/driver.py +549 -942
sqlspec/adapters/psqlpy/__init__.py +4 -7
sqlspec/adapters/psqlpy/config.py +372 -203
sqlspec/adapters/psqlpy/driver.py +197 -550
sqlspec/adapters/psycopg/__init__.py +3 -8
sqlspec/adapters/psycopg/config.py +741 -0
sqlspec/adapters/psycopg/driver.py +732 -733
sqlspec/adapters/sqlite/__init__.py +2 -6
sqlspec/adapters/sqlite/config.py +146 -81
sqlspec/adapters/sqlite/driver.py +243 -426
sqlspec/base.py +220 -825
sqlspec/config.py +354 -0
sqlspec/driver/__init__.py +22 -0
sqlspec/driver/_async.py +252 -0
sqlspec/driver/_common.py +338 -0
sqlspec/driver/_sync.py +261 -0
sqlspec/driver/mixins/__init__.py +17 -0
sqlspec/driver/mixins/_pipeline.py +523 -0
sqlspec/driver/mixins/_result_utils.py +122 -0
sqlspec/driver/mixins/_sql_translator.py +35 -0
sqlspec/driver/mixins/_storage.py +993 -0
sqlspec/driver/mixins/_type_coercion.py +131 -0
sqlspec/exceptions.py +299 -7
sqlspec/extensions/aiosql/__init__.py +10 -0
sqlspec/extensions/aiosql/adapter.py +474 -0
sqlspec/extensions/litestar/__init__.py +1 -6
sqlspec/extensions/litestar/_utils.py +1 -5
sqlspec/extensions/litestar/config.py +5 -6
sqlspec/extensions/litestar/handlers.py +13 -12
sqlspec/extensions/litestar/plugin.py +22 -24
sqlspec/extensions/litestar/providers.py +37 -55
sqlspec/loader.py +528 -0
sqlspec/service/__init__.py +3 -0
sqlspec/service/base.py +24 -0
sqlspec/service/pagination.py +26 -0
sqlspec/statement/__init__.py +21 -0
sqlspec/statement/builder/__init__.py +54 -0
sqlspec/statement/builder/_ddl_utils.py +119 -0
sqlspec/statement/builder/_parsing_utils.py +135 -0
sqlspec/statement/builder/base.py +328 -0
sqlspec/statement/builder/ddl.py +1379 -0
sqlspec/statement/builder/delete.py +80 -0
sqlspec/statement/builder/insert.py +274 -0
sqlspec/statement/builder/merge.py +95 -0
sqlspec/statement/builder/mixins/__init__.py +65 -0
sqlspec/statement/builder/mixins/_aggregate_functions.py +151 -0
sqlspec/statement/builder/mixins/_case_builder.py +91 -0
sqlspec/statement/builder/mixins/_common_table_expr.py +91 -0
sqlspec/statement/builder/mixins/_delete_from.py +34 -0
sqlspec/statement/builder/mixins/_from.py +61 -0
sqlspec/statement/builder/mixins/_group_by.py +119 -0
sqlspec/statement/builder/mixins/_having.py +35 -0
sqlspec/statement/builder/mixins/_insert_from_select.py +48 -0
sqlspec/statement/builder/mixins/_insert_into.py +36 -0
sqlspec/statement/builder/mixins/_insert_values.py +69 -0
sqlspec/statement/builder/mixins/_join.py +110 -0
sqlspec/statement/builder/mixins/_limit_offset.py +53 -0
sqlspec/statement/builder/mixins/_merge_clauses.py +405 -0
sqlspec/statement/builder/mixins/_order_by.py +46 -0
sqlspec/statement/builder/mixins/_pivot.py +82 -0
sqlspec/statement/builder/mixins/_returning.py +37 -0
sqlspec/statement/builder/mixins/_select_columns.py +60 -0
sqlspec/statement/builder/mixins/_set_ops.py +122 -0
sqlspec/statement/builder/mixins/_unpivot.py +80 -0
sqlspec/statement/builder/mixins/_update_from.py +54 -0
sqlspec/statement/builder/mixins/_update_set.py +91 -0
sqlspec/statement/builder/mixins/_update_table.py +29 -0
sqlspec/statement/builder/mixins/_where.py +374 -0
sqlspec/statement/builder/mixins/_window_functions.py +86 -0
sqlspec/statement/builder/protocols.py +20 -0
sqlspec/statement/builder/select.py +206 -0
sqlspec/statement/builder/update.py +178 -0
sqlspec/statement/filters.py +571 -0
sqlspec/statement/parameters.py +736 -0
sqlspec/statement/pipelines/__init__.py +67 -0
sqlspec/statement/pipelines/analyzers/__init__.py +9 -0
sqlspec/statement/pipelines/analyzers/_analyzer.py +649 -0
sqlspec/statement/pipelines/base.py +315 -0
sqlspec/statement/pipelines/context.py +119 -0
sqlspec/statement/pipelines/result_types.py +41 -0
sqlspec/statement/pipelines/transformers/__init__.py +8 -0
sqlspec/statement/pipelines/transformers/_expression_simplifier.py +256 -0
sqlspec/statement/pipelines/transformers/_literal_parameterizer.py +623 -0
sqlspec/statement/pipelines/transformers/_remove_comments.py +66 -0
sqlspec/statement/pipelines/transformers/_remove_hints.py +81 -0
sqlspec/statement/pipelines/validators/__init__.py +23 -0
sqlspec/statement/pipelines/validators/_dml_safety.py +275 -0
sqlspec/statement/pipelines/validators/_parameter_style.py +297 -0
sqlspec/statement/pipelines/validators/_performance.py +703 -0
sqlspec/statement/pipelines/validators/_security.py +990 -0
sqlspec/statement/pipelines/validators/base.py +67 -0
sqlspec/statement/result.py +527 -0
sqlspec/statement/splitter.py +701 -0
sqlspec/statement/sql.py +1198 -0
sqlspec/storage/__init__.py +15 -0
sqlspec/storage/backends/__init__.py +0 -0
sqlspec/storage/backends/base.py +166 -0
sqlspec/storage/backends/fsspec.py +315 -0
sqlspec/storage/backends/obstore.py +464 -0
sqlspec/storage/protocol.py +170 -0
sqlspec/storage/registry.py +315 -0
sqlspec/typing.py +157 -36
sqlspec/utils/correlation.py +155 -0
sqlspec/utils/deprecation.py +3 -6
sqlspec/utils/fixtures.py +6 -11
sqlspec/utils/logging.py +135 -0
sqlspec/utils/module_loader.py +45 -43
sqlspec/utils/serializers.py +4 -0
sqlspec/utils/singleton.py +6 -8
sqlspec/utils/sync_tools.py +15 -27
sqlspec/utils/text.py +58 -26
{sqlspec-0.11.0.dist-info → sqlspec-0.12.0.dist-info}/METADATA +100 -26
sqlspec-0.12.0.dist-info/RECORD +145 -0
sqlspec/adapters/bigquery/config/__init__.py +0 -3
sqlspec/adapters/bigquery/config/_common.py +0 -40
sqlspec/adapters/bigquery/config/_sync.py +0 -87
sqlspec/adapters/oracledb/config/__init__.py +0 -9
sqlspec/adapters/oracledb/config/_asyncio.py +0 -186
sqlspec/adapters/oracledb/config/_common.py +0 -131
sqlspec/adapters/oracledb/config/_sync.py +0 -186
sqlspec/adapters/psycopg/config/__init__.py +0 -19
sqlspec/adapters/psycopg/config/_async.py +0 -169
sqlspec/adapters/psycopg/config/_common.py +0 -56
sqlspec/adapters/psycopg/config/_sync.py +0 -168
sqlspec/filters.py +0 -330
sqlspec/mixins.py +0 -306
sqlspec/statement.py +0 -378
sqlspec-0.11.0.dist-info/RECORD +0 -69
{sqlspec-0.11.0.dist-info → sqlspec-0.12.0.dist-info}/WHEEL +0 -0
{sqlspec-0.11.0.dist-info → sqlspec-0.12.0.dist-info}/licenses/LICENSE +0 -0
{sqlspec-0.11.0.dist-info → sqlspec-0.12.0.dist-info}/licenses/NOTICE +0 -0

sqlspec/statement/pipelines/validators/_performance.py ADDED Viewed

@@ -0,0 +1,703 @@
+"""Performance validator for SQL query optimization."""
+import logging
+from collections import defaultdict
+from dataclasses import dataclass, field
+from typing import TYPE_CHECKING, Any, Optional
+from sqlglot import expressions as exp
+from sqlglot.optimizer import (
+    eliminate_joins,
+    eliminate_subqueries,
+    merge_subqueries,
+    normalize_identifiers,
+    optimize_joins,
+    pushdown_predicates,
+    pushdown_projections,
+    simplify,
+)
+from sqlspec.exceptions import RiskLevel
+from sqlspec.statement.pipelines.validators.base import BaseValidator
+if TYPE_CHECKING:
+    from sqlspec.statement.pipelines.context import SQLProcessingContext
+__all__ = (
+    "JoinCondition",
+    "OptimizationOpportunity",
+    "PerformanceAnalysis",
+    "PerformanceConfig",
+    "PerformanceIssue",
+    "PerformanceValidator",
+)
+logger = logging.getLogger(__name__)
+# Constants
+DEEP_NESTING_THRESHOLD = 2
+@dataclass
+class PerformanceConfig:
+    """Configuration for performance validation."""
+    max_joins: int = 5
+    max_subqueries: int = 3
+    max_union_branches: int = 5
+    warn_on_cartesian: bool = True
+    warn_on_missing_index: bool = True
+    complexity_threshold: int = 50
+    analyze_execution_plan: bool = False
+    # SQLGlot optimization analysis
+    enable_optimization_analysis: bool = True
+    suggest_optimizations: bool = True
+    optimization_threshold: float = 0.2  # 20% potential improvement to flag
+    max_optimization_attempts: int = 3
+@dataclass
+class PerformanceIssue:
+    """Represents a performance issue found during validation."""
+    issue_type: str  # "cartesian", "excessive_joins", "missing_index", etc.
+    severity: str  # "warning", "error", "critical"
+    description: str
+    impact: str  # Expected performance impact
+    recommendation: str
+    location: "Optional[str]" = None  # SQL fragment
+@dataclass
+class JoinCondition:
+    """Information about a join condition."""
+    left_table: str
+    right_table: str
+    condition: "Optional[exp.Expression]"
+    join_type: str
+@dataclass
+class OptimizationOpportunity:
+    """Represents a potential optimization for the query."""
+    optimization_type: str  # "join_elimination", "predicate_pushdown", etc.
+    description: str
+    potential_improvement: float  # Estimated improvement factor (0.0 to 1.0)
+    complexity_reduction: int  # Estimated complexity score reduction
+    recommendation: str
+    optimized_sql: "Optional[str]" = None
+@dataclass
+class PerformanceAnalysis:
+    """Tracks performance metrics during AST traversal."""
+    # Join analysis
+    join_count: int = 0
+    join_types: "dict[str, int]" = field(default_factory=dict)
+    join_conditions: "list[JoinCondition]" = field(default_factory=list)
+    tables: "set[str]" = field(default_factory=set)
+    # Subquery analysis
+    subquery_count: int = 0
+    max_subquery_depth: int = 0
+    current_subquery_depth: int = 0
+    correlated_subqueries: int = 0
+    # Complexity metrics
+    where_conditions: int = 0
+    group_by_columns: int = 0
+    order_by_columns: int = 0
+    distinct_operations: int = 0
+    union_branches: int = 0
+    # Anti-patterns
+    select_star_count: int = 0
+    implicit_conversions: int = 0
+    non_sargable_predicates: int = 0
+    # SQLGlot optimization analysis
+    optimization_opportunities: "list[OptimizationOpportunity]" = field(default_factory=list)
+    original_complexity: int = 0
+    optimized_complexity: int = 0
+    potential_improvement: float = 0.0
+class PerformanceValidator(BaseValidator):
+    """Comprehensive query performance validator.
+    Validates query performance by detecting:
+    - Cartesian products
+    - Excessive joins
+    - Deep subquery nesting
+    - Performance anti-patterns
+    - High query complexity
+    """
+    def __init__(self, config: "Optional[PerformanceConfig]" = None) -> None:
+        """Initialize the performance validator.
+        Args:
+            config: Configuration for performance validation
+        """
+        super().__init__()
+        self.config = config or PerformanceConfig()
+    def validate(self, expression: "exp.Expression", context: "SQLProcessingContext") -> None:
+        """Validate SQL statement for performance issues.
+        Args:
+            expression: The SQL expression to validate
+            context: The SQL processing context
+        """
+        # Performance analysis state
+        analysis = PerformanceAnalysis()
+        # Single traversal for all checks
+        self._analyze_expression(expression, analysis)
+        # Calculate baseline complexity
+        analysis.original_complexity = self._calculate_complexity(analysis)
+        # Perform SQLGlot optimization analysis if enabled
+        if self.config.enable_optimization_analysis:
+            self._analyze_optimization_opportunities(expression, analysis, context)
+        # Check for cartesian products
+        if self.config.warn_on_cartesian:
+            cartesian_issues = self._check_cartesian_products(analysis)
+            for issue in cartesian_issues:
+                self.add_error(
+                    context,
+                    message=issue.description,
+                    code=issue.issue_type,
+                    risk_level=self._severity_to_risk_level(issue.severity),
+                    expression=expression,
+                )
+        # Check join complexity
+        if analysis.join_count > self.config.max_joins:
+            self.add_error(
+                context,
+                message=f"Query has {analysis.join_count} joins (max: {self.config.max_joins})",
+                code="excessive-joins",
+                risk_level=RiskLevel.MEDIUM,
+                expression=expression,
+            )
+        # Check subquery depth
+        if analysis.max_subquery_depth > self.config.max_subqueries:
+            self.add_error(
+                context,
+                message=f"Query has {analysis.max_subquery_depth} levels of subqueries",
+                code="deep-nesting",
+                risk_level=RiskLevel.MEDIUM,
+                expression=expression,
+            )
+        # Check for performance anti-patterns
+        pattern_issues = self._check_antipatterns(analysis)
+        for issue in pattern_issues:
+            self.add_error(
+                context,
+                message=issue.description,
+                code=issue.issue_type,
+                risk_level=self._severity_to_risk_level(issue.severity),
+                expression=expression,
+            )
+        # Calculate overall complexity score
+        complexity_score = self._calculate_complexity(analysis)
+        # Build metadata
+        context.metadata[self.__class__.__name__] = {
+            "complexity_score": complexity_score,
+            "join_analysis": {
+                "total_joins": analysis.join_count,
+                "join_types": dict(analysis.join_types),
+                "tables_involved": list(analysis.tables),
+            },
+            "subquery_analysis": {
+                "max_depth": analysis.max_subquery_depth,
+                "total_subqueries": analysis.subquery_count,
+                "correlated_subqueries": analysis.correlated_subqueries,
+            },
+            "optimization_analysis": {
+                "opportunities": [self._optimization_to_dict(opt) for opt in analysis.optimization_opportunities],
+                "original_complexity": analysis.original_complexity,
+                "optimized_complexity": analysis.optimized_complexity,
+                "potential_improvement": analysis.potential_improvement,
+                "optimization_enabled": self.config.enable_optimization_analysis,
+            },
+        }
+    @staticmethod
+    def _severity_to_risk_level(severity: str) -> RiskLevel:
+        """Convert severity string to RiskLevel."""
+        mapping = {
+            "critical": RiskLevel.CRITICAL,
+            "error": RiskLevel.HIGH,
+            "warning": RiskLevel.MEDIUM,
+            "info": RiskLevel.LOW,
+        }
+        return mapping.get(severity.lower(), RiskLevel.MEDIUM)
+    def _analyze_expression(self, expr: "exp.Expression", analysis: PerformanceAnalysis, depth: int = 0) -> None:
+        """Single-pass traversal to collect all performance metrics.
+        Args:
+            expr: Expression to analyze
+            analysis: Analysis state to update
+            depth: Current recursion depth
+        """
+        # Track subquery depth
+        if isinstance(expr, exp.Subquery):
+            analysis.subquery_count += 1
+            analysis.current_subquery_depth = max(analysis.current_subquery_depth, depth + 1)
+            analysis.max_subquery_depth = max(analysis.max_subquery_depth, analysis.current_subquery_depth)
+            # Check if correlated
+            if self._is_correlated_subquery(expr):
+                analysis.correlated_subqueries += 1
+        # Analyze joins
+        elif isinstance(expr, exp.Join):
+            analysis.join_count += 1
+            join_type = expr.args.get("kind", "INNER").upper()
+            analysis.join_types[join_type] = analysis.join_types.get(join_type, 0) + 1
+            # Extract join condition
+            condition = expr.args.get("on")
+            left_table = self._get_table_name(expr.parent) if expr.parent else "unknown"
+            right_table = self._get_table_name(expr.this)
+            analysis.join_conditions.append(
+                JoinCondition(left_table=left_table, right_table=right_table, condition=condition, join_type=join_type)
+            )
+            analysis.tables.add(left_table)
+            analysis.tables.add(right_table)
+        # Track other complexity factors
+        elif isinstance(expr, exp.Where):
+            analysis.where_conditions += len(list(expr.find_all(exp.Predicate)))
+        elif isinstance(expr, exp.Group):
+            analysis.group_by_columns += len(expr.expressions) if hasattr(expr, "expressions") else 0
+        elif isinstance(expr, exp.Order):
+            analysis.order_by_columns += len(expr.expressions) if hasattr(expr, "expressions") else 0
+        elif isinstance(expr, exp.Distinct):
+            analysis.distinct_operations += 1
+        elif isinstance(expr, exp.Union):
+            analysis.union_branches += 1
+        elif isinstance(expr, exp.Star):
+            analysis.select_star_count += 1
+        # Recursive traversal
+        for child in expr.args.values():
+            if isinstance(child, exp.Expression):
+                self._analyze_expression(child, analysis, depth)
+            elif isinstance(child, list):
+                for item in child:
+                    if isinstance(item, exp.Expression):
+                        self._analyze_expression(item, analysis, depth)
+    def _check_cartesian_products(self, analysis: PerformanceAnalysis) -> "list[PerformanceIssue]":
+        """Detect potential cartesian products from join analysis.
+        Args:
+            analysis: Performance analysis state
+        Returns:
+            List of cartesian product issues
+        """
+        issues = []
+        # Group joins by table pairs
+        join_graph: dict[str, set[str]] = defaultdict(set)
+        for condition in analysis.join_conditions:
+            if condition.condition is None:  # CROSS JOIN
+                issues.append(
+                    PerformanceIssue(
+                        issue_type="cartesian_product",
+                        severity="critical",
+                        description=f"Explicit CROSS JOIN between {condition.left_table} and {condition.right_table}",
+                        impact="Result set grows exponentially (MxN rows)",
+                        recommendation="Add join condition or use WHERE clause",
+                    )
+                )
+            else:
+                # Build join graph
+                join_graph[condition.left_table].add(condition.right_table)
+                join_graph[condition.right_table].add(condition.left_table)
+        # Check for disconnected tables (implicit cartesian)
+        if len(analysis.tables) > 1:
+            connected = self._find_connected_components(join_graph, analysis.tables)
+            if len(connected) > 1:
+                disconnected_tables = [list(component) for component in connected if len(component) > 0]
+                issues.append(
+                    PerformanceIssue(
+                        issue_type="implicit_cartesian",
+                        severity="critical",
+                        description=f"Tables form disconnected groups: {disconnected_tables}",
+                        impact="Implicit cartesian product between table groups",
+                        recommendation="Add join conditions between table groups",
+                    )
+                )
+        return issues
+    @staticmethod
+    def _check_antipatterns(analysis: PerformanceAnalysis) -> "list[PerformanceIssue]":
+        """Check for common performance anti-patterns.
+        Args:
+            analysis: Performance analysis state
+        Returns:
+            List of anti-pattern issues
+        """
+        issues = []
+        # SELECT * in production queries
+        if analysis.select_star_count > 0:
+            issues.append(
+                PerformanceIssue(
+                    issue_type="select_star",
+                    severity="info",  # Changed to info level
+                    description=f"Query uses SELECT * ({analysis.select_star_count} occurrences)",
+                    impact="Fetches unnecessary columns, breaks with schema changes",
+                    recommendation="Explicitly list required columns",
+                )
+            )
+        # Non-sargable predicates
+        if analysis.non_sargable_predicates > 0:
+            issues.append(
+                PerformanceIssue(
+                    issue_type="non_sargable",
+                    severity="warning",
+                    description=f"Query has {analysis.non_sargable_predicates} non-sargable predicates",
+                    impact="Cannot use indexes effectively",
+                    recommendation="Rewrite predicates to be sargable (avoid functions on columns)",
+                )
+            )
+        # Correlated subqueries
+        if analysis.correlated_subqueries > 0:
+            issues.append(
+                PerformanceIssue(
+                    issue_type="correlated_subquery",
+                    severity="warning",
+                    description=f"Query has {analysis.correlated_subqueries} correlated subqueries",
+                    impact="Subquery executes once per outer row (N+1 problem)",
+                    recommendation="Rewrite using JOIN or window functions",
+                )
+            )
+        # Deep nesting
+        if analysis.max_subquery_depth > DEEP_NESTING_THRESHOLD:
+            issues.append(
+                PerformanceIssue(
+                    issue_type="deep_nesting",
+                    severity="warning",
+                    description=f"Query has {analysis.max_subquery_depth} levels of nesting",
+                    impact="Difficult for optimizer, hard to maintain",
+                    recommendation="Use CTEs to flatten query structure",
+                )
+            )
+        return issues
+    @staticmethod
+    def _calculate_complexity(analysis: PerformanceAnalysis) -> int:
+        """Calculate overall query complexity score.
+        Args:
+            analysis: Performance analysis state
+        Returns:
+            Complexity score
+        """
+        score = 0
+        # Join complexity (exponential factor)
+        score += analysis.join_count**2 * 5
+        # Subquery complexity
+        score += analysis.subquery_count * 10
+        score += analysis.correlated_subqueries * 20
+        score += analysis.max_subquery_depth * 15
+        # Predicate complexity
+        score += analysis.where_conditions * 2
+        # Grouping/sorting complexity
+        score += analysis.group_by_columns * 3
+        score += analysis.order_by_columns * 2
+        score += analysis.distinct_operations * 5
+        # Anti-pattern penalties
+        score += analysis.select_star_count * 5
+        score += analysis.non_sargable_predicates * 10
+        # Union complexity
+        score += analysis.union_branches * 8
+        return score
+    def _determine_risk_level(self, issues: "list[PerformanceIssue]", complexity_score: int) -> RiskLevel:
+        """Determine overall risk level from issues and complexity.
+        Args:
+            issues: List of performance issues
+            complexity_score: Calculated complexity score
+        Returns:
+            Overall risk level
+        """
+        if any(issue.severity == "critical" for issue in issues):
+            return RiskLevel.CRITICAL
+        if complexity_score > self.config.complexity_threshold * 2:
+            return RiskLevel.HIGH
+        if any(issue.severity == "error" for issue in issues):
+            return RiskLevel.HIGH
+        if complexity_score > self.config.complexity_threshold:
+            return RiskLevel.MEDIUM
+        if any(issue.severity == "warning" for issue in issues):
+            return RiskLevel.LOW
+        return RiskLevel.SKIP
+    @staticmethod
+    def _is_correlated_subquery(subquery: "exp.Subquery") -> bool:
+        """Check if subquery is correlated (references outer query).
+        Args:
+            subquery: Subquery expression
+        Returns:
+            True if correlated
+        """
+        # Simplified check - look for column references without table qualifiers
+        # In a real implementation, would need to track scope
+        return any(not col.table for col in subquery.find_all(exp.Column))
+    @staticmethod
+    def _get_table_name(expr: "Optional[exp.Expression]") -> str:
+        """Extract table name from expression.
+        Args:
+            expr: Expression to extract from
+        Returns:
+            Table name or "unknown"
+        """
+        if expr is None:
+            return "unknown"
+        if isinstance(expr, exp.Table):
+            return expr.name
+        # Try to find table in expression
+        tables = list(expr.find_all(exp.Table))
+        if tables:
+            return tables[0].name
+        return "unknown"
+    @staticmethod
+    def _find_connected_components(graph: "dict[str, set[str]]", nodes: "set[str]") -> "list[set[str]]":
+        """Find connected components in join graph.
+        Args:
+            graph: Adjacency list representation
+            nodes: All nodes to consider
+        Returns:
+            List of connected components
+        """
+        visited = set()
+        components = []
+        def dfs(node: str, component: "set[str]") -> None:
+            """Depth-first search to find component."""
+            visited.add(node)
+            component.add(node)
+            for neighbor in graph.get(node, set()):
+                if neighbor not in visited and neighbor in nodes:
+                    dfs(neighbor, component)
+        for node in nodes:
+            if node not in visited:
+                component: set[str] = set()
+                dfs(node, component)
+                components.append(component)
+        return components
+    def _analyze_optimization_opportunities(
+        self, expression: "exp.Expression", analysis: PerformanceAnalysis, context: "SQLProcessingContext"
+    ) -> None:
+        """Analyze query using SQLGlot optimizers to find improvement opportunities.
+        Args:
+            expression: The SQL expression to analyze
+            analysis: Analysis state to update
+            context: Processing context for dialect information
+        """
+        if not expression:
+            return
+        original_sql = expression.sql(dialect=context.dialect)
+        opportunities = []
+        try:
+            # Try different SQLGlot optimization strategies
+            optimizations = [
+                ("join_elimination", eliminate_joins.eliminate_joins, "Eliminate unnecessary joins"),
+                ("subquery_elimination", eliminate_subqueries.eliminate_subqueries, "Eliminate or merge subqueries"),
+                ("subquery_merging", merge_subqueries.merge_subqueries, "Merge subqueries into main query"),
+                (
+                    "predicate_pushdown",
+                    pushdown_predicates.pushdown_predicates,
+                    "Push predicates closer to data sources",
+                ),
+                (
+                    "projection_pushdown",
+                    pushdown_projections.pushdown_projections,
+                    "Push projections down to reduce data movement",
+                ),
+                ("join_optimization", optimize_joins.optimize_joins, "Optimize join order and conditions"),
+                ("simplification", simplify.simplify, "Simplify expressions and conditions"),
+                (
+                    "identifier_normalization",
+                    normalize_identifiers.normalize_identifiers,
+                    "Normalize identifier casing",
+                ),
+            ]
+            best_optimized = expression.copy()
+            cumulative_improvement = 0.0
+            for opt_type, optimizer, description in optimizations:
+                try:
+                    # Apply the optimization
+                    optimized = optimizer(expression.copy(), dialect=context.dialect)  # type: ignore[operator]
+                    if optimized is None:
+                        continue
+                    optimized_sql = optimized.sql(dialect=context.dialect)
+                    # Skip if no changes made
+                    if optimized_sql == original_sql:
+                        continue
+                    # Calculate complexity before and after
+                    original_temp_analysis = PerformanceAnalysis()
+                    optimized_temp_analysis = PerformanceAnalysis()
+                    self._analyze_expression(expression, original_temp_analysis)
+                    self._analyze_expression(optimized, optimized_temp_analysis)
+                    original_complexity = self._calculate_complexity(original_temp_analysis)
+                    optimized_complexity = self._calculate_complexity(optimized_temp_analysis)
+                    # Calculate improvement factor
+                    if original_complexity > 0:
+                        improvement = (original_complexity - optimized_complexity) / original_complexity
+                    else:
+                        improvement = 0.0
+                    # Only add if improvement meets threshold
+                    if improvement >= self.config.optimization_threshold:
+                        opportunities.append(
+                            OptimizationOpportunity(
+                                optimization_type=opt_type,
+                                description=f"{description} (complexity reduction: {original_complexity - optimized_complexity})",
+                                potential_improvement=improvement,
+                                complexity_reduction=original_complexity - optimized_complexity,
+                                recommendation=f"Apply {opt_type}: {description.lower()}",
+                                optimized_sql=optimized_sql,
+                            )
+                        )
+                        # Update the best optimization if this is better
+                        if improvement > cumulative_improvement:
+                            best_optimized = optimized
+                            cumulative_improvement = improvement
+                except Exception as e:
+                    # Optimization failed, log and continue with next one
+                    logger.debug("SQLGlot optimization failed: %s", e)
+                    continue
+            # Calculate final optimized complexity
+            if opportunities:
+                optimized_analysis = PerformanceAnalysis()
+                self._analyze_expression(best_optimized, optimized_analysis)
+                analysis.optimized_complexity = self._calculate_complexity(optimized_analysis)
+                analysis.potential_improvement = cumulative_improvement
+            else:
+                analysis.optimized_complexity = analysis.original_complexity
+                analysis.potential_improvement = 0.0
+            analysis.optimization_opportunities = opportunities
+        except Exception:
+            # If optimization analysis fails completely, just skip it
+            analysis.optimization_opportunities = []
+            analysis.optimized_complexity = analysis.original_complexity
+            analysis.potential_improvement = 0.0
+    @staticmethod
+    def _optimization_to_dict(optimization: OptimizationOpportunity) -> "dict[str, Any]":
+        """Convert OptimizationOpportunity to dictionary.
+        Args:
+            optimization: The optimization opportunity
+        Returns:
+            Dictionary representation
+        """
+        return {
+            "optimization_type": optimization.optimization_type,
+            "description": optimization.description,
+            "potential_improvement": optimization.potential_improvement,
+            "complexity_reduction": optimization.complexity_reduction,
+            "recommendation": optimization.recommendation,
+            "optimized_sql": optimization.optimized_sql,
+        }
+    @staticmethod
+    def _issue_to_dict(issue: PerformanceIssue) -> "dict[str, Any]":
+        """Convert PerformanceIssue to dictionary.
+        Args:
+            issue: The performance issue
+        Returns:
+            Dictionary representation
+        """
+        return {
+            "issue_type": issue.issue_type,
+            "severity": issue.severity,
+            "description": issue.description,
+            "impact": issue.impact,
+            "recommendation": issue.recommendation,
+            "location": issue.location,
+        }

sqlspec 0.11.0__py3-none-any.whl → 0.12.0__py3-none-any.whl

Potentially problematic release.

sqlspec 0.11.0py3-none-any.whl → 0.12.0py3-none-any.whl