PyPI - sqlspec - Versions diffs - 0.12.1__py3-none-any.whl → 0.13.0__py3-none-any.whl - Mend

sqlspec 0.12.1py3-none-any.whl → 0.13.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of sqlspec might be problematic. Click here for more details.

Files changed (113) hide show

sqlspec/_sql.py +21 -180
sqlspec/adapters/adbc/config.py +10 -12
sqlspec/adapters/adbc/driver.py +120 -118
sqlspec/adapters/aiosqlite/config.py +3 -3
sqlspec/adapters/aiosqlite/driver.py +116 -141
sqlspec/adapters/asyncmy/config.py +3 -4
sqlspec/adapters/asyncmy/driver.py +123 -135
sqlspec/adapters/asyncpg/config.py +3 -7
sqlspec/adapters/asyncpg/driver.py +98 -140
sqlspec/adapters/bigquery/config.py +4 -5
sqlspec/adapters/bigquery/driver.py +231 -181
sqlspec/adapters/duckdb/config.py +3 -6
sqlspec/adapters/duckdb/driver.py +132 -124
sqlspec/adapters/oracledb/config.py +6 -5
sqlspec/adapters/oracledb/driver.py +242 -259
sqlspec/adapters/psqlpy/config.py +3 -7
sqlspec/adapters/psqlpy/driver.py +118 -93
sqlspec/adapters/psycopg/config.py +34 -30
sqlspec/adapters/psycopg/driver.py +342 -214
sqlspec/adapters/sqlite/config.py +3 -3
sqlspec/adapters/sqlite/driver.py +150 -104
sqlspec/config.py +0 -4
sqlspec/driver/_async.py +89 -98
sqlspec/driver/_common.py +52 -17
sqlspec/driver/_sync.py +81 -105
sqlspec/driver/connection.py +207 -0
sqlspec/driver/mixins/_csv_writer.py +91 -0
sqlspec/driver/mixins/_pipeline.py +38 -49
sqlspec/driver/mixins/_result_utils.py +27 -9
sqlspec/driver/mixins/_storage.py +149 -216
sqlspec/driver/mixins/_type_coercion.py +3 -4
sqlspec/driver/parameters.py +138 -0
sqlspec/exceptions.py +10 -2
sqlspec/extensions/aiosql/adapter.py +0 -10
sqlspec/extensions/litestar/handlers.py +0 -1
sqlspec/extensions/litestar/plugin.py +0 -3
sqlspec/extensions/litestar/providers.py +0 -14
sqlspec/loader.py +31 -118
sqlspec/protocols.py +542 -0
sqlspec/service/__init__.py +3 -2
sqlspec/service/_util.py +147 -0
sqlspec/service/base.py +1116 -9
sqlspec/statement/builder/__init__.py +42 -32
sqlspec/statement/builder/_ddl_utils.py +0 -10
sqlspec/statement/builder/_parsing_utils.py +10 -4
sqlspec/statement/builder/base.py +70 -23
sqlspec/statement/builder/column.py +283 -0
sqlspec/statement/builder/ddl.py +102 -65
sqlspec/statement/builder/delete.py +23 -7
sqlspec/statement/builder/insert.py +29 -15
sqlspec/statement/builder/merge.py +4 -4
sqlspec/statement/builder/mixins/_aggregate_functions.py +113 -14
sqlspec/statement/builder/mixins/_common_table_expr.py +0 -1
sqlspec/statement/builder/mixins/_delete_from.py +1 -1
sqlspec/statement/builder/mixins/_from.py +10 -8
sqlspec/statement/builder/mixins/_group_by.py +0 -1
sqlspec/statement/builder/mixins/_insert_from_select.py +0 -1
sqlspec/statement/builder/mixins/_insert_values.py +0 -2
sqlspec/statement/builder/mixins/_join.py +20 -13
sqlspec/statement/builder/mixins/_limit_offset.py +3 -3
sqlspec/statement/builder/mixins/_merge_clauses.py +3 -4
sqlspec/statement/builder/mixins/_order_by.py +2 -2
sqlspec/statement/builder/mixins/_pivot.py +4 -7
sqlspec/statement/builder/mixins/_select_columns.py +6 -5
sqlspec/statement/builder/mixins/_unpivot.py +6 -9
sqlspec/statement/builder/mixins/_update_from.py +2 -1
sqlspec/statement/builder/mixins/_update_set.py +11 -8
sqlspec/statement/builder/mixins/_where.py +61 -34
sqlspec/statement/builder/select.py +32 -17
sqlspec/statement/builder/update.py +25 -11
sqlspec/statement/filters.py +39 -14
sqlspec/statement/parameter_manager.py +220 -0
sqlspec/statement/parameters.py +210 -79
sqlspec/statement/pipelines/__init__.py +166 -23
sqlspec/statement/pipelines/analyzers/_analyzer.py +22 -25
sqlspec/statement/pipelines/context.py +35 -39
sqlspec/statement/pipelines/transformers/__init__.py +2 -3
sqlspec/statement/pipelines/transformers/_expression_simplifier.py +19 -187
sqlspec/statement/pipelines/transformers/_literal_parameterizer.py +667 -43
sqlspec/statement/pipelines/transformers/_remove_comments_and_hints.py +76 -0
sqlspec/statement/pipelines/validators/_dml_safety.py +33 -18
sqlspec/statement/pipelines/validators/_parameter_style.py +87 -14
sqlspec/statement/pipelines/validators/_performance.py +38 -23
sqlspec/statement/pipelines/validators/_security.py +39 -62
sqlspec/statement/result.py +37 -129
sqlspec/statement/splitter.py +0 -12
sqlspec/statement/sql.py +885 -379
sqlspec/statement/sql_compiler.py +140 -0
sqlspec/storage/__init__.py +10 -2
sqlspec/storage/backends/fsspec.py +82 -35
sqlspec/storage/backends/obstore.py +66 -49
sqlspec/storage/capabilities.py +101 -0
sqlspec/storage/registry.py +56 -83
sqlspec/typing.py +6 -434
sqlspec/utils/cached_property.py +25 -0
sqlspec/utils/correlation.py +0 -2
sqlspec/utils/logging.py +0 -6
sqlspec/utils/sync_tools.py +0 -4
sqlspec/utils/text.py +0 -5
sqlspec/utils/type_guards.py +892 -0
{sqlspec-0.12.1.dist-info → sqlspec-0.13.0.dist-info}/METADATA +1 -1
sqlspec-0.13.0.dist-info/RECORD +150 -0
sqlspec/statement/builder/protocols.py +0 -20
sqlspec/statement/pipelines/base.py +0 -315
sqlspec/statement/pipelines/result_types.py +0 -41
sqlspec/statement/pipelines/transformers/_remove_comments.py +0 -66
sqlspec/statement/pipelines/transformers/_remove_hints.py +0 -81
sqlspec/statement/pipelines/validators/base.py +0 -67
sqlspec/storage/protocol.py +0 -170
sqlspec-0.12.1.dist-info/RECORD +0 -145
{sqlspec-0.12.1.dist-info → sqlspec-0.13.0.dist-info}/WHEEL +0 -0
{sqlspec-0.12.1.dist-info → sqlspec-0.13.0.dist-info}/licenses/LICENSE +0 -0
{sqlspec-0.12.1.dist-info → sqlspec-0.13.0.dist-info}/licenses/NOTICE +0 -0

sqlspec/adapters/bigquery/driver.py CHANGED Viewed

@@ -1,6 +1,8 @@
+import contextlib
 import datetime
 import io
 import logging
+import uuid
 from collections.abc import Iterator
 from decimal import Decimal
 from typing import TYPE_CHECKING, Any, Callable, ClassVar, Optional, Union, cast
@@ -8,15 +10,18 @@ from typing import TYPE_CHECKING, Any, Callable, ClassVar, Optional, Union, cast
 from google.cloud.bigquery import (
     ArrayQueryParameter,
     Client,
+    ExtractJobConfig,
     LoadJobConfig,
     QueryJob,
     QueryJobConfig,
     ScalarQueryParameter,
+    SourceFormat,
     WriteDisposition,
 )
 from google.cloud.bigquery.table import Row as BigQueryRow
 from sqlspec.driver import SyncDriverAdapterProtocol
+from sqlspec.driver.connection import managed_transaction_sync
 from sqlspec.driver.mixins import (
     SQLTranslatorMixin,
     SyncPipelinedExecutionMixin,
@@ -24,14 +29,17 @@ from sqlspec.driver.mixins import (
     ToSchemaMixin,
     TypeCoercionMixin,
 )
+from sqlspec.driver.parameters import normalize_parameter_sequence
 from sqlspec.exceptions import SQLSpecError
-from sqlspec.statement.parameters import ParameterStyle
-from sqlspec.statement.result import ArrowResult, DMLResultDict, ScriptResultDict, SelectResultDict, SQLResult
+from sqlspec.statement.parameters import ParameterStyle, ParameterValidator
+from sqlspec.statement.result import ArrowResult, SQLResult
 from sqlspec.statement.sql import SQL, SQLConfig
-from sqlspec.typing import DictRow, ModelDTOT, RowT
+from sqlspec.typing import DictRow, RowT
 from sqlspec.utils.serializers import to_json
 if TYPE_CHECKING:
+    from pathlib import Path
     from sqlglot.dialects.dialect import DialectType
@@ -134,6 +142,10 @@ class BigQueryDriver(
         Raises:
             SQLSpecError: If value type is not supported.
         """
+        if value is None:
+            # BigQuery handles NULL values without explicit type
+            return ("STRING", None)  # Use STRING type for NULL values
         value_type = type(value)
         if value_type is datetime.datetime:
             return ("TIMESTAMP" if value.tzinfo else "DATETIME", None)
@@ -152,7 +164,6 @@ class BigQueryDriver(
         if value_type in type_map:
             return type_map[value_type]
-        # Handle lists/tuples for ARRAY type
         if isinstance(value, (list, tuple)):
             if not value:
                 msg = "Cannot determine BigQuery ARRAY type for empty sequence. Provide typed empty array or ensure context implies type."
@@ -186,8 +197,7 @@ class BigQueryDriver(
             for name, value in params_dict.items():
                 param_name_for_bq = name.lstrip("@")
-                # Extract value from TypedParameter if needed
-                actual_value = value.value if hasattr(value, "value") else value
+                actual_value = getattr(value, "value", value)
                 param_type, array_element_type = self._get_bq_param_type(actual_value)
@@ -232,18 +242,14 @@ class BigQueryDriver(
         """
         conn = connection or self.connection
-        # Build final job configuration
         final_job_config = QueryJobConfig()
-        # Apply default configuration if available
         if self._default_query_job_config:
             self._copy_job_config_attrs(self._default_query_job_config, final_job_config)
-        # Apply override configuration if provided
         if job_config:
             self._copy_job_config_attrs(job_config, final_job_config)
-        # Set query parameters
         final_job_config.query_parameters = bq_query_parameters or []
         # Debug log the actual parameters being sent
@@ -258,23 +264,14 @@ class BigQueryDriver(
                     param_value,
                     type(param_value),
                 )
-        # Let BigQuery generate the job ID to avoid collisions
-        # This is the recommended approach for production code and works better with emulators
-        logger.warning("About to send to BigQuery - SQL: %r", sql_str)
-        logger.warning("Query parameters in job config: %r", final_job_config.query_parameters)
         query_job = conn.query(sql_str, job_config=final_job_config)
-        # Get the auto-generated job ID for callbacks
         if self.on_job_start and query_job.job_id:
-            try:
+            with contextlib.suppress(Exception):
                 self.on_job_start(query_job.job_id)
-            except Exception as e:
-                logger.warning("Job start callback failed: %s", str(e), extra={"adapter": "bigquery"})
         if self.on_job_complete and query_job.job_id:
-            try:
+            with contextlib.suppress(Exception):
                 self.on_job_complete(query_job.job_id, query_job)
-            except Exception as e:
-                logger.warning("Job complete callback failed: %s", str(e), extra={"adapter": "bigquery"})
         return query_job
@@ -290,15 +287,21 @@ class BigQueryDriver(
         """
         return [dict(row) for row in rows_iterator]  # type: ignore[misc]
-    def _handle_select_job(self, query_job: QueryJob) -> SelectResultDict:
+    def _handle_select_job(self, query_job: QueryJob, statement: SQL) -> SQLResult[RowT]:
         """Handle a query job that is expected to return rows."""
         job_result = query_job.result()
         rows_list = self._rows_to_results(iter(job_result))
         column_names = [field.name for field in query_job.schema] if query_job.schema else []
-        return {"data": rows_list, "column_names": column_names, "rows_affected": len(rows_list)}
+        return SQLResult(
+            statement=statement,
+            data=rows_list,
+            column_names=column_names,
+            rows_affected=len(rows_list),
+            operation_type="SELECT",
+        )
-    def _handle_dml_job(self, query_job: QueryJob) -> DMLResultDict:
+    def _handle_dml_job(self, query_job: QueryJob, statement: SQL) -> SQLResult[RowT]:
         """Handle a DML job.
         Note: BigQuery emulators (e.g., goccy/bigquery-emulator) may report 0 rows affected
@@ -324,7 +327,14 @@ class BigQueryDriver(
             )
             num_affected = 1  # Assume at least one row was affected
-        return {"rows_affected": num_affected or 0, "status_message": f"OK - job_id: {query_job.job_id}"}
+        operation_type = self._determine_operation_type(statement)
+        return SQLResult(
+            statement=statement,
+            data=cast("list[RowT]", []),
+            rows_affected=num_affected or 0,
+            operation_type=operation_type,
+            metadata={"status_message": f"OK - job_id: {query_job.job_id}"},
+        )
     def _compile_bigquery_compatible(self, statement: SQL, target_style: ParameterStyle) -> tuple[str, Any]:
         """Compile SQL statement for BigQuery.
@@ -336,12 +346,18 @@ class BigQueryDriver(
     def _execute_statement(
         self, statement: SQL, connection: Optional[BigQueryConnection] = None, **kwargs: Any
-    ) -> Union[SelectResultDict, DMLResultDict, ScriptResultDict]:
+    ) -> SQLResult[RowT]:
         if statement.is_script:
             sql, _ = statement.compile(placeholder_style=ParameterStyle.STATIC)
             return self._execute_script(sql, connection=connection, **kwargs)
-        detected_styles = {p.style for p in statement.parameter_info}
+        detected_styles = set()
+        sql_str = statement.to_sql(placeholder_style=None)  # Get raw SQL
+        validator = self.config.parameter_validator if self.config else ParameterValidator()
+        param_infos = validator.extract_parameters(sql_str)
+        if param_infos:
+            detected_styles = {p.style for p in param_infos}
         target_style = self.default_parameter_style
         unsupported_styles = detected_styles - set(self.supported_parameter_styles)
@@ -359,167 +375,116 @@ class BigQueryDriver(
             return self._execute_many(sql, params, connection=connection, **kwargs)
         sql, params = self._compile_bigquery_compatible(statement, target_style)
-        logger.debug("compile() returned - sql: %r, params: %r", sql, params)
         params = self._process_parameters(params)
-        logger.debug("after _process_parameters - params: %r", params)
         return self._execute(sql, params, statement, connection=connection, **kwargs)
     def _execute(
         self, sql: str, parameters: Any, statement: SQL, connection: Optional[BigQueryConnection] = None, **kwargs: Any
-    ) -> Union[SelectResultDict, DMLResultDict]:
-        # SQL should already be in correct format from compile()
-        converted_sql = sql
-        # Parameters are already in the correct format from compile()
-        converted_params = parameters
-        # Prepare BigQuery parameters
-        # Convert various parameter formats to dict format for BigQuery
-        param_dict: dict[str, Any]
-        if converted_params is None:
-            param_dict = {}
-        elif isinstance(converted_params, dict):
-            # Filter out non-parameter keys (dialect, config, etc.)
-            # Real parameters start with 'param_' or are user-provided named parameters
-            param_dict = {
-                k: v
-                for k, v in converted_params.items()
-                if k.startswith("param_") or (not k.startswith("_") and k not in {"dialect", "config"})
-            }
-        elif isinstance(converted_params, (list, tuple)):
-            # Convert positional parameters to named parameters for BigQuery
-            # Use param_N to match the compiled SQL placeholders
-            param_dict = {f"param_{i}": val for i, val in enumerate(converted_params)}
-        else:
-            # Single scalar parameter
-            param_dict = {"param_0": converted_params}
+    ) -> SQLResult[RowT]:
+        # Use provided connection or driver's default connection
+        conn = connection if connection is not None else self._connection(None)
+        # BigQuery doesn't have traditional transactions, but we'll use the pattern for consistency
+        # The managed_transaction_sync will just pass through for BigQuery Client objects
+        with managed_transaction_sync(conn, auto_commit=True) as txn_conn:
+            # Normalize parameters using consolidated utility
+            normalized_params = normalize_parameter_sequence(parameters)
+            param_dict: dict[str, Any] = {}
+            if normalized_params:
+                if isinstance(normalized_params[0], dict):
+                    param_dict = normalized_params[0]
+                else:
+                    param_dict = {f"param_{i}": val for i, val in enumerate(normalized_params)}
-        bq_params = self._prepare_bq_query_parameters(param_dict)
+            bq_params = self._prepare_bq_query_parameters(param_dict)
-        query_job = self._run_query_job(converted_sql, bq_params, connection=connection)
+            query_job = self._run_query_job(sql, bq_params, connection=txn_conn)
-        if query_job.statement_type == "SELECT" or (
-            hasattr(query_job, "schema") and query_job.schema and len(query_job.schema) > 0
-        ):
-            return self._handle_select_job(query_job)
-        return self._handle_dml_job(query_job)
+            query_schema = getattr(query_job, "schema", None)
+            if query_job.statement_type == "SELECT" or (query_schema is not None and len(query_schema) > 0):
+                return self._handle_select_job(query_job, statement)
+            return self._handle_dml_job(query_job, statement)
     def _execute_many(
         self, sql: str, param_list: Any, connection: Optional[BigQueryConnection] = None, **kwargs: Any
-    ) -> DMLResultDict:
-        # Use a multi-statement script for batch execution
-        script_parts = []
-        all_params: dict[str, Any] = {}
-        param_counter = 0
-        for params in param_list or []:
-            # Convert various parameter formats to dict format for BigQuery
-            if isinstance(params, dict):
-                param_dict = params
-            elif isinstance(params, (list, tuple)):
-                # Convert positional parameters to named parameters matching SQL placeholders
-                param_dict = {f"param_{i}": val for i, val in enumerate(params)}
-            else:
-                # Single scalar parameter
-                param_dict = {"param_0": params}
-            # Remap parameters to be unique across the entire script
-            param_mapping = {}
-            current_sql = sql
-            for key, value in param_dict.items():
-                new_key = f"p_{param_counter}"
-                param_counter += 1
-                param_mapping[key] = new_key
-                all_params[new_key] = value
-            # Replace placeholders in the SQL for this statement
-            for old_key, new_key in param_mapping.items():
-                current_sql = current_sql.replace(f"@{old_key}", f"@{new_key}")
-            script_parts.append(current_sql)
-        # Execute as a single script
-        full_script = ";\n".join(script_parts)
-        bq_params = self._prepare_bq_query_parameters(all_params)
-        # Filter out kwargs that _run_query_job doesn't expect
-        query_kwargs = {k: v for k, v in kwargs.items() if k not in {"parameters", "is_many"}}
-        query_job = self._run_query_job(full_script, bq_params, connection=connection, **query_kwargs)
-        # Wait for the job to complete
-        query_job.result(timeout=kwargs.get("bq_job_timeout"))
-        total_rowcount = query_job.num_dml_affected_rows or 0
-        return {"rows_affected": total_rowcount, "status_message": f"OK - executed batch job {query_job.job_id}"}
+    ) -> SQLResult[RowT]:
+        # Use provided connection or driver's default connection
+        conn = connection if connection is not None else self._connection(None)
+        with managed_transaction_sync(conn, auto_commit=True) as txn_conn:
+            # Normalize parameter list using consolidated utility
+            normalized_param_list = normalize_parameter_sequence(param_list)
+            # Use a multi-statement script for batch execution
+            script_parts = []
+            all_params: dict[str, Any] = {}
+            param_counter = 0
+            for params in normalized_param_list or []:
+                if isinstance(params, dict):
+                    param_dict = params
+                elif isinstance(params, (list, tuple)):
+                    param_dict = {f"param_{i}": val for i, val in enumerate(params)}
+                else:
+                    param_dict = {"param_0": params}
+                # Remap parameters to be unique across the entire script
+                param_mapping = {}
+                current_sql = sql
+                for key, value in param_dict.items():
+                    new_key = f"p_{param_counter}"
+                    param_counter += 1
+                    param_mapping[key] = new_key
+                    all_params[new_key] = value
+                for old_key, new_key in param_mapping.items():
+                    current_sql = current_sql.replace(f"@{old_key}", f"@{new_key}")
+                script_parts.append(current_sql)
+            # Execute as a single script
+            full_script = ";\n".join(script_parts)
+            bq_params = self._prepare_bq_query_parameters(all_params)
+            # Filter out kwargs that _run_query_job doesn't expect
+            query_kwargs = {k: v for k, v in kwargs.items() if k not in {"parameters", "is_many"}}
+            query_job = self._run_query_job(full_script, bq_params, connection=txn_conn, **query_kwargs)
+            # Wait for the job to complete
+            query_job.result(timeout=kwargs.get("bq_job_timeout"))
+            total_rowcount = query_job.num_dml_affected_rows or 0
+            return SQLResult(
+                statement=SQL(sql, _dialect=self.dialect),
+                data=[],
+                rows_affected=total_rowcount,
+                operation_type="EXECUTE",
+                metadata={"status_message": f"OK - executed batch job {query_job.job_id}"},
+            )
     def _execute_script(
         self, script: str, connection: Optional[BigQueryConnection] = None, **kwargs: Any
-    ) -> ScriptResultDict:
-        # BigQuery does not support multi-statement scripts in a single job
-        # Use the shared implementation to split and execute statements individually
-        statements = self._split_script_statements(script)
-        for statement in statements:
-            if statement:
-                query_job = self._run_query_job(statement, [], connection=connection)
-                query_job.result(timeout=kwargs.get("bq_job_timeout"))
-        return {"statements_executed": len(statements), "status_message": "SCRIPT EXECUTED"}
-    def _wrap_select_result(
-        self, statement: SQL, result: SelectResultDict, schema_type: "Optional[type[ModelDTOT]]" = None, **kwargs: Any
-    ) -> "Union[SQLResult[RowT], SQLResult[ModelDTOT]]":
-        if schema_type:
-            return cast(
-                "SQLResult[ModelDTOT]",
-                SQLResult(
-                    statement=statement,
-                    data=cast("list[ModelDTOT]", list(self.to_schema(data=result["data"], schema_type=schema_type))),
-                    column_names=result["column_names"],
-                    rows_affected=result["rows_affected"],
-                    operation_type="SELECT",
-                ),
-            )
+    ) -> SQLResult[RowT]:
+        # Use provided connection or driver's default connection
+        conn = connection if connection is not None else self._connection(None)
-        return cast(
-            "SQLResult[RowT]",
-            SQLResult(
-                statement=statement,
-                data=result["data"],
-                column_names=result["column_names"],
-                operation_type="SELECT",
-                rows_affected=result["rows_affected"],
-            ),
-        )
+        with managed_transaction_sync(conn, auto_commit=True) as txn_conn:
+            # BigQuery does not support multi-statement scripts in a single job
+            statements = self._split_script_statements(script)
+            for statement in statements:
+                if statement:
+                    query_job = self._run_query_job(statement, [], connection=txn_conn)
+                    query_job.result(timeout=kwargs.get("bq_job_timeout"))
-    def _wrap_execute_result(
-        self, statement: SQL, result: Union[DMLResultDict, ScriptResultDict], **kwargs: Any
-    ) -> "SQLResult[RowT]":
-        operation_type = "UNKNOWN"
-        if statement.expression:
-            operation_type = str(statement.expression.key).upper()
-        if "statements_executed" in result:
-            return SQLResult[RowT](
-                statement=statement,
+            return SQLResult(
+                statement=SQL(script, _dialect=self.dialect).as_script(),
                 data=[],
                 rows_affected=0,
                 operation_type="SCRIPT",
-                metadata={
-                    "status_message": result.get("status_message", ""),
-                    "statements_executed": result.get("statements_executed", -1),
-                },
-            )
-        if "rows_affected" in result:
-            dml_result = cast("DMLResultDict", result)
-            rows_affected = dml_result["rows_affected"]
-            status_message = dml_result.get("status_message", "")
-            return SQLResult[RowT](
-                statement=statement,
-                data=[],
-                rows_affected=rows_affected,
-                operation_type=operation_type,
-                metadata={"status_message": status_message},
+                metadata={"status_message": "SCRIPT EXECUTED"},
+                total_statements=len(statements),
+                successful_statements=len(statements),
             )
-        msg = f"Unexpected result type: {type(result)}"
-        raise ValueError(msg)
     def _connection(self, connection: "Optional[Client]" = None) -> "Client":
         """Get the connection to use for the operation."""
@@ -529,28 +494,115 @@ class BigQueryDriver(
     # BigQuery Native Export Support
     # ============================================================================
-    def _export_native(self, query: str, destination_uri: str, format: str, **options: Any) -> int:
-        """BigQuery native export implementation.
+    def _export_native(self, query: str, destination_uri: "Union[str, Path]", format: str, **options: Any) -> int:
+        """BigQuery native export implementation with automatic GCS staging.
-        For local files, BigQuery doesn't support direct export, so we raise NotImplementedError
-        to trigger the fallback mechanism that uses fetch + write.
+        For GCS URIs, uses direct export. For other locations, automatically stages
+        through a temporary GCS location and transfers to the final destination.
         Args:
             query: SQL query to execute
-            destination_uri: Destination URI (local file path or gs:// URI)
+            destination_uri: Destination URI (local file path, gs:// URI, or Path object)
             format: Export format (parquet, csv, json, avro)
-            **options: Additional export options
+            **options: Additional export options including 'gcs_staging_bucket'
         Returns:
             Number of rows exported
         Raises:
-            NotImplementedError: Always, to trigger fallback to fetch + write
+            NotImplementedError: If no staging bucket is configured for non-GCS destinations
         """
-        # BigQuery only supports native export to GCS, not local files
-        # By raising NotImplementedError, the mixin will fall back to fetch + write
-        msg = "BigQuery native export only supports GCS URIs, using fallback for local files"
-        raise NotImplementedError(msg)
+        destination_str = str(destination_uri)
+        # If it's already a GCS URI, use direct export
+        if destination_str.startswith("gs://"):
+            return self._export_to_gcs_native(query, destination_str, format, **options)
+        staging_bucket = options.get("gcs_staging_bucket") or getattr(self.config, "gcs_staging_bucket", None)
+        if not staging_bucket:
+            # Fall back to fetch + write for non-GCS destinations without staging
+            msg = "BigQuery native export requires GCS staging bucket for non-GCS destinations"
+            raise NotImplementedError(msg)
+        # Generate temporary GCS path
+        from datetime import timezone
+        timestamp = datetime.datetime.now(timezone.utc).strftime("%Y%m%d_%H%M%S")
+        temp_filename = f"bigquery_export_{timestamp}_{uuid.uuid4().hex[:8]}.{format}"
+        temp_gcs_uri = f"gs://{staging_bucket}/temp_exports/{temp_filename}"
+        try:
+            # Export to temporary GCS location
+            rows_exported = self._export_to_gcs_native(query, temp_gcs_uri, format, **options)
+            # Transfer from GCS to final destination using storage backend
+            backend, path = self._resolve_backend_and_path(destination_str)
+            gcs_backend = self._get_storage_backend(temp_gcs_uri)
+            # Download from GCS and upload to final destination
+            data = gcs_backend.read_bytes(temp_gcs_uri)
+            backend.write_bytes(path, data)
+            return rows_exported
+        finally:
+            # Clean up temporary file
+            try:
+                gcs_backend = self._get_storage_backend(temp_gcs_uri)
+                gcs_backend.delete(temp_gcs_uri)
+            except Exception as e:
+                logger.warning("Failed to clean up temporary GCS file %s: %s", temp_gcs_uri, e)
+    def _export_to_gcs_native(self, query: str, gcs_uri: str, format: str, **options: Any) -> int:
+        """Direct BigQuery export to GCS.
+        Args:
+            query: SQL query to execute
+            gcs_uri: GCS destination URI (must start with gs://)
+            format: Export format (parquet, csv, json, avro)
+            **options: Additional export options
+        Returns:
+            Number of rows exported
+        """
+        # First, run the query and store results in a temporary table
+        temp_table_id = f"temp_export_{uuid.uuid4().hex[:8]}"
+        dataset_id = getattr(self.connection, "default_dataset", None) or options.get("dataset", "temp")
+        query_with_table = f"CREATE OR REPLACE TABLE `{dataset_id}.{temp_table_id}` AS {query}"
+        create_job = self._run_query_job(query_with_table, [])
+        create_job.result()
+        count_query = f"SELECT COUNT(*) as cnt FROM `{dataset_id}.{temp_table_id}`"
+        count_job = self._run_query_job(count_query, [])
+        count_result = list(count_job.result())
+        row_count = count_result[0]["cnt"] if count_result else 0
+        try:
+            # Configure extract job
+            extract_config = ExtractJobConfig(**options)  # type: ignore[no-untyped-call]
+            format_mapping = {
+                "parquet": SourceFormat.PARQUET,
+                "csv": SourceFormat.CSV,
+                "json": SourceFormat.NEWLINE_DELIMITED_JSON,
+                "avro": SourceFormat.AVRO,
+            }
+            extract_config.destination_format = format_mapping.get(format, SourceFormat.PARQUET)
+            table_ref = self.connection.dataset(dataset_id).table(temp_table_id)
+            extract_job = self.connection.extract_table(table_ref, gcs_uri, job_config=extract_config)
+            extract_job.result()
+            return row_count
+        finally:
+            # Clean up temporary table
+            try:
+                delete_query = f"DROP TABLE IF EXISTS `{dataset_id}.{temp_table_id}`"
+                delete_job = self._run_query_job(delete_query, [])
+                delete_job.result()
+            except Exception as e:
+                logger.warning("Failed to clean up temporary table %s: %s", temp_table_id, e)
     # ============================================================================
     # BigQuery Native Arrow Support
@@ -570,7 +622,6 @@ class BigQueryDriver(
         Returns:
             ArrowResult with native Arrow table
         """
         # Execute the query directly with BigQuery to get the QueryJob
         params = sql.get_parameters(style=self.default_parameter_style)
         params_dict: dict[str, Any] = {}
@@ -650,7 +701,6 @@ class BigQueryDriver(
             raise ValueError(msg)
         # Use BigQuery's native Arrow loading
-        # Convert Arrow table to bytes for direct loading
         import pyarrow.parquet as pq

sqlspec/adapters/duckdb/config.py CHANGED Viewed

@@ -2,7 +2,6 @@
 import logging
 from contextlib import contextmanager
-from dataclasses import replace
 from typing import TYPE_CHECKING, Any, Callable, ClassVar, Optional, TypedDict
 import duckdb
@@ -336,11 +335,9 @@ class DuckDBConfig(NoPoolSyncConfig[DuckDBConnection, DuckDBDriver]):
         # DuckDB connect() only accepts database, read_only, and config parameters
         connect_params: dict[str, Any] = {}
-        # Set database if provided
         if hasattr(self, "database") and self.database is not None:
             connect_params["database"] = self.database
-        # Set read_only if provided
         if hasattr(self, "read_only") and self.read_only is not None:
             connect_params["read_only"] = self.read_only
@@ -352,7 +349,6 @@ class DuckDBConfig(NoPoolSyncConfig[DuckDBConnection, DuckDBDriver]):
                 if value is not None and value is not Empty:
                     config_dict[field] = value
-        # Add extras to config dict
         config_dict.update(self.extras)
         # If we have config parameters, add them
@@ -475,15 +471,16 @@ class DuckDBConfig(NoPoolSyncConfig[DuckDBConnection, DuckDBDriver]):
         @contextmanager
         def session_manager() -> "Generator[DuckDBDriver, None, None]":
             with self.provide_connection(*args, **kwargs) as connection:
-                # Create statement config with parameter style info if not already set
                 statement_config = self.statement_config
+                # Inject parameter style info if not already set
                 if statement_config.allowed_parameter_styles is None:
+                    from dataclasses import replace
                     statement_config = replace(
                         statement_config,
                         allowed_parameter_styles=self.supported_parameter_styles,
                         target_parameter_style=self.preferred_parameter_style,
                     )
                 driver = self.driver_type(connection=connection, config=statement_config)
                 yield driver

sqlspec 0.12.1__py3-none-any.whl → 0.13.0__py3-none-any.whl

Potentially problematic release.

sqlspec 0.12.1py3-none-any.whl → 0.13.0py3-none-any.whl