PyPI - sqlspec - Versions diffs - 0.11.1__py3-none-any.whl → 0.12.1__py3-none-any.whl - Mend

sqlspec 0.11.1py3-none-any.whl → 0.12.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of sqlspec might be problematic. Click here for more details.

Files changed (155) hide show

sqlspec/__init__.py +16 -3
sqlspec/_serialization.py +3 -10
sqlspec/_sql.py +1147 -0
sqlspec/_typing.py +343 -41
sqlspec/adapters/adbc/__init__.py +2 -6
sqlspec/adapters/adbc/config.py +474 -149
sqlspec/adapters/adbc/driver.py +330 -621
sqlspec/adapters/aiosqlite/__init__.py +2 -6
sqlspec/adapters/aiosqlite/config.py +143 -57
sqlspec/adapters/aiosqlite/driver.py +269 -431
sqlspec/adapters/asyncmy/__init__.py +3 -8
sqlspec/adapters/asyncmy/config.py +247 -202
sqlspec/adapters/asyncmy/driver.py +218 -436
sqlspec/adapters/asyncpg/__init__.py +4 -7
sqlspec/adapters/asyncpg/config.py +329 -176
sqlspec/adapters/asyncpg/driver.py +417 -487
sqlspec/adapters/bigquery/__init__.py +2 -2
sqlspec/adapters/bigquery/config.py +407 -0
sqlspec/adapters/bigquery/driver.py +600 -553
sqlspec/adapters/duckdb/__init__.py +4 -1
sqlspec/adapters/duckdb/config.py +432 -321
sqlspec/adapters/duckdb/driver.py +392 -406
sqlspec/adapters/oracledb/__init__.py +3 -8
sqlspec/adapters/oracledb/config.py +625 -0
sqlspec/adapters/oracledb/driver.py +548 -921
sqlspec/adapters/psqlpy/__init__.py +4 -7
sqlspec/adapters/psqlpy/config.py +372 -203
sqlspec/adapters/psqlpy/driver.py +197 -533
sqlspec/adapters/psycopg/__init__.py +3 -8
sqlspec/adapters/psycopg/config.py +725 -0
sqlspec/adapters/psycopg/driver.py +734 -694
sqlspec/adapters/sqlite/__init__.py +2 -6
sqlspec/adapters/sqlite/config.py +146 -81
sqlspec/adapters/sqlite/driver.py +242 -405
sqlspec/base.py +220 -784
sqlspec/config.py +354 -0
sqlspec/driver/__init__.py +22 -0
sqlspec/driver/_async.py +252 -0
sqlspec/driver/_common.py +338 -0
sqlspec/driver/_sync.py +261 -0
sqlspec/driver/mixins/__init__.py +17 -0
sqlspec/driver/mixins/_pipeline.py +523 -0
sqlspec/driver/mixins/_result_utils.py +122 -0
sqlspec/driver/mixins/_sql_translator.py +35 -0
sqlspec/driver/mixins/_storage.py +993 -0
sqlspec/driver/mixins/_type_coercion.py +131 -0
sqlspec/exceptions.py +299 -7
sqlspec/extensions/aiosql/__init__.py +10 -0
sqlspec/extensions/aiosql/adapter.py +474 -0
sqlspec/extensions/litestar/__init__.py +1 -6
sqlspec/extensions/litestar/_utils.py +1 -5
sqlspec/extensions/litestar/config.py +5 -6
sqlspec/extensions/litestar/handlers.py +13 -12
sqlspec/extensions/litestar/plugin.py +22 -24
sqlspec/extensions/litestar/providers.py +37 -55
sqlspec/loader.py +528 -0
sqlspec/service/__init__.py +3 -0
sqlspec/service/base.py +24 -0
sqlspec/service/pagination.py +26 -0
sqlspec/statement/__init__.py +21 -0
sqlspec/statement/builder/__init__.py +54 -0
sqlspec/statement/builder/_ddl_utils.py +119 -0
sqlspec/statement/builder/_parsing_utils.py +135 -0
sqlspec/statement/builder/base.py +328 -0
sqlspec/statement/builder/ddl.py +1379 -0
sqlspec/statement/builder/delete.py +80 -0
sqlspec/statement/builder/insert.py +274 -0
sqlspec/statement/builder/merge.py +95 -0
sqlspec/statement/builder/mixins/__init__.py +65 -0
sqlspec/statement/builder/mixins/_aggregate_functions.py +151 -0
sqlspec/statement/builder/mixins/_case_builder.py +91 -0
sqlspec/statement/builder/mixins/_common_table_expr.py +91 -0
sqlspec/statement/builder/mixins/_delete_from.py +34 -0
sqlspec/statement/builder/mixins/_from.py +61 -0
sqlspec/statement/builder/mixins/_group_by.py +119 -0
sqlspec/statement/builder/mixins/_having.py +35 -0
sqlspec/statement/builder/mixins/_insert_from_select.py +48 -0
sqlspec/statement/builder/mixins/_insert_into.py +36 -0
sqlspec/statement/builder/mixins/_insert_values.py +69 -0
sqlspec/statement/builder/mixins/_join.py +110 -0
sqlspec/statement/builder/mixins/_limit_offset.py +53 -0
sqlspec/statement/builder/mixins/_merge_clauses.py +405 -0
sqlspec/statement/builder/mixins/_order_by.py +46 -0
sqlspec/statement/builder/mixins/_pivot.py +82 -0
sqlspec/statement/builder/mixins/_returning.py +37 -0
sqlspec/statement/builder/mixins/_select_columns.py +60 -0
sqlspec/statement/builder/mixins/_set_ops.py +122 -0
sqlspec/statement/builder/mixins/_unpivot.py +80 -0
sqlspec/statement/builder/mixins/_update_from.py +54 -0
sqlspec/statement/builder/mixins/_update_set.py +91 -0
sqlspec/statement/builder/mixins/_update_table.py +29 -0
sqlspec/statement/builder/mixins/_where.py +374 -0
sqlspec/statement/builder/mixins/_window_functions.py +86 -0
sqlspec/statement/builder/protocols.py +20 -0
sqlspec/statement/builder/select.py +206 -0
sqlspec/statement/builder/update.py +178 -0
sqlspec/statement/filters.py +571 -0
sqlspec/statement/parameters.py +736 -0
sqlspec/statement/pipelines/__init__.py +67 -0
sqlspec/statement/pipelines/analyzers/__init__.py +9 -0
sqlspec/statement/pipelines/analyzers/_analyzer.py +649 -0
sqlspec/statement/pipelines/base.py +315 -0
sqlspec/statement/pipelines/context.py +119 -0
sqlspec/statement/pipelines/result_types.py +41 -0
sqlspec/statement/pipelines/transformers/__init__.py +8 -0
sqlspec/statement/pipelines/transformers/_expression_simplifier.py +256 -0
sqlspec/statement/pipelines/transformers/_literal_parameterizer.py +623 -0
sqlspec/statement/pipelines/transformers/_remove_comments.py +66 -0
sqlspec/statement/pipelines/transformers/_remove_hints.py +81 -0
sqlspec/statement/pipelines/validators/__init__.py +23 -0
sqlspec/statement/pipelines/validators/_dml_safety.py +275 -0
sqlspec/statement/pipelines/validators/_parameter_style.py +297 -0
sqlspec/statement/pipelines/validators/_performance.py +703 -0
sqlspec/statement/pipelines/validators/_security.py +990 -0
sqlspec/statement/pipelines/validators/base.py +67 -0
sqlspec/statement/result.py +527 -0
sqlspec/statement/splitter.py +701 -0
sqlspec/statement/sql.py +1198 -0
sqlspec/storage/__init__.py +15 -0
sqlspec/storage/backends/__init__.py +0 -0
sqlspec/storage/backends/base.py +166 -0
sqlspec/storage/backends/fsspec.py +315 -0
sqlspec/storage/backends/obstore.py +464 -0
sqlspec/storage/protocol.py +170 -0
sqlspec/storage/registry.py +315 -0
sqlspec/typing.py +157 -36
sqlspec/utils/correlation.py +155 -0
sqlspec/utils/deprecation.py +3 -6
sqlspec/utils/fixtures.py +6 -11
sqlspec/utils/logging.py +135 -0
sqlspec/utils/module_loader.py +45 -43
sqlspec/utils/serializers.py +4 -0
sqlspec/utils/singleton.py +6 -8
sqlspec/utils/sync_tools.py +15 -27
sqlspec/utils/text.py +58 -26
{sqlspec-0.11.1.dist-info → sqlspec-0.12.1.dist-info}/METADATA +97 -26
sqlspec-0.12.1.dist-info/RECORD +145 -0
sqlspec/adapters/bigquery/config/__init__.py +0 -3
sqlspec/adapters/bigquery/config/_common.py +0 -40
sqlspec/adapters/bigquery/config/_sync.py +0 -87
sqlspec/adapters/oracledb/config/__init__.py +0 -9
sqlspec/adapters/oracledb/config/_asyncio.py +0 -186
sqlspec/adapters/oracledb/config/_common.py +0 -131
sqlspec/adapters/oracledb/config/_sync.py +0 -186
sqlspec/adapters/psycopg/config/__init__.py +0 -19
sqlspec/adapters/psycopg/config/_async.py +0 -169
sqlspec/adapters/psycopg/config/_common.py +0 -56
sqlspec/adapters/psycopg/config/_sync.py +0 -168
sqlspec/filters.py +0 -331
sqlspec/mixins.py +0 -305
sqlspec/statement.py +0 -378
sqlspec-0.11.1.dist-info/RECORD +0 -69
{sqlspec-0.11.1.dist-info → sqlspec-0.12.1.dist-info}/WHEEL +0 -0
{sqlspec-0.11.1.dist-info → sqlspec-0.12.1.dist-info}/licenses/LICENSE +0 -0
{sqlspec-0.11.1.dist-info → sqlspec-0.12.1.dist-info}/licenses/NOTICE +0 -0

sqlspec/adapters/duckdb/driver.py CHANGED Viewed

@@ -1,425 +1,411 @@
-import logging
+import contextlib
+import uuid
+from collections.abc import Generator
 from contextlib import contextmanager
-from typing import TYPE_CHECKING, Any, Optional, Union, cast, overload
+from typing import TYPE_CHECKING, Any, ClassVar, Optional, Union, cast
 from duckdb import DuckDBPyConnection
-from sqlspec.base import SyncDriverAdapterProtocol
-from sqlspec.filters import StatementFilter
-from sqlspec.mixins import ResultConverter, SQLTranslatorMixin, SyncArrowBulkOperationsMixin
-from sqlspec.statement import SQLStatement
-from sqlspec.typing import ArrowTable, StatementParameterType
+from sqlglot import exp
+from sqlspec.driver import SyncDriverAdapterProtocol
+from sqlspec.driver.mixins import (
+    SQLTranslatorMixin,
+    SyncPipelinedExecutionMixin,
+    SyncStorageMixin,
+    ToSchemaMixin,
+    TypeCoercionMixin,
+)
+from sqlspec.statement.parameters import ParameterStyle
+from sqlspec.statement.result import ArrowResult, DMLResultDict, ScriptResultDict, SelectResultDict, SQLResult
+from sqlspec.statement.sql import SQL, SQLConfig
+from sqlspec.typing import ArrowTable, DictRow, ModelDTOT, RowT
+from sqlspec.utils.logging import get_logger
 if TYPE_CHECKING:
-    from collections.abc import Generator, Mapping, Sequence
+    from sqlglot.dialects.dialect import DialectType
-    from sqlspec.typing import ArrowTable, ModelDTOT, StatementParameterType, T
+    from sqlspec.typing import ArrowTable
 __all__ = ("DuckDBConnection", "DuckDBDriver")
-logger = logging.getLogger("sqlspec")
 DuckDBConnection = DuckDBPyConnection
+logger = get_logger("adapters.duckdb")
 class DuckDBDriver(
-    SyncArrowBulkOperationsMixin["DuckDBConnection"],
-    SQLTranslatorMixin["DuckDBConnection"],
-    SyncDriverAdapterProtocol["DuckDBConnection"],
-    ResultConverter,
+    SyncDriverAdapterProtocol["DuckDBConnection", RowT],
+    SQLTranslatorMixin,
+    TypeCoercionMixin,
+    SyncStorageMixin,
+    SyncPipelinedExecutionMixin,
+    ToSchemaMixin,
 ):
-    """DuckDB Sync Driver Adapter."""
-    connection: "DuckDBConnection"
-    use_cursor: bool = True
-    dialect: str = "duckdb"
-    def __init__(self, connection: "DuckDBConnection", use_cursor: bool = True) -> None:
-        self.connection = connection
-        self.use_cursor = use_cursor
-    def _cursor(self, connection: "DuckDBConnection") -> "DuckDBConnection":
-        if self.use_cursor:
-            return connection.cursor()
-        return connection
+    """DuckDB Sync Driver Adapter with modern architecture.
+    DuckDB is a fast, in-process analytical database built for modern data analysis.
+    This driver provides:
+    - High-performance columnar query execution
+    - Excellent Arrow integration for analytics workloads
+    - Direct file querying (CSV, Parquet, JSON) without imports
+    - Extension ecosystem for cloud storage and formats
+    - Zero-copy operations where possible
+    """
+    dialect: "DialectType" = "duckdb"
+    supported_parameter_styles: "tuple[ParameterStyle, ...]" = (ParameterStyle.QMARK, ParameterStyle.NUMERIC)
+    default_parameter_style: ParameterStyle = ParameterStyle.QMARK
+    supports_native_arrow_export: ClassVar[bool] = True
+    supports_native_arrow_import: ClassVar[bool] = True
+    supports_native_parquet_export: ClassVar[bool] = True
+    supports_native_parquet_import: ClassVar[bool] = True
+    __slots__ = ()
+    def __init__(
+        self,
+        connection: "DuckDBConnection",
+        config: "Optional[SQLConfig]" = None,
+        default_row_type: "type[DictRow]" = DictRow,
+    ) -> None:
+        super().__init__(connection=connection, config=config, default_row_type=default_row_type)
+    @staticmethod
     @contextmanager
-    def _with_cursor(self, connection: "DuckDBConnection") -> "Generator[DuckDBConnection, None, None]":
-        if self.use_cursor:
-            cursor = self._cursor(connection)
+    def _get_cursor(connection: "DuckDBConnection") -> Generator["DuckDBConnection", None, None]:
+        cursor = connection.cursor()
+        try:
+            yield cursor
+        finally:
+            cursor.close()
+    def _execute_statement(
+        self, statement: SQL, connection: Optional["DuckDBConnection"] = None, **kwargs: Any
+    ) -> "Union[SelectResultDict, DMLResultDict, ScriptResultDict]":
+        if statement.is_script:
+            sql, _ = statement.compile(placeholder_style=ParameterStyle.STATIC)
+            return self._execute_script(sql, connection=connection, **kwargs)
+        if statement.is_many:
+            sql, params = statement.compile(placeholder_style=self.default_parameter_style)
+            params = self._process_parameters(params)
+            return self._execute_many(sql, params, connection=connection, **kwargs)
+        sql, params = statement.compile(placeholder_style=self.default_parameter_style)
+        params = self._process_parameters(params)
+        return self._execute(sql, params, statement, connection=connection, **kwargs)
+    def _execute(
+        self, sql: str, parameters: Any, statement: SQL, connection: Optional["DuckDBConnection"] = None, **kwargs: Any
+    ) -> "Union[SelectResultDict, DMLResultDict]":
+        conn = self._connection(connection)
+        if self.returns_rows(statement.expression):
+            result = conn.execute(sql, parameters or [])
+            fetched_data = result.fetchall()
+            column_names = [col[0] for col in result.description or []]
+            return {"data": fetched_data, "column_names": column_names, "rows_affected": len(fetched_data)}
+        with self._get_cursor(conn) as cursor:
+            cursor.execute(sql, parameters or [])
+            # DuckDB returns -1 for rowcount on DML operations
+            # However, fetchone() returns the actual affected row count as (count,)
+            rows_affected = cursor.rowcount
+            if rows_affected < 0:
+                try:
+                    # Get actual affected row count from fetchone()
+                    fetch_result = cursor.fetchone()
+                    if fetch_result and isinstance(fetch_result, (tuple, list)) and len(fetch_result) > 0:
+                        rows_affected = fetch_result[0]
+                    else:
+                        rows_affected = 0
+                except Exception:
+                    # Fallback to 1 if fetchone fails
+                    rows_affected = 1
+            return {"rows_affected": rows_affected}
+    def _execute_many(
+        self, sql: str, param_list: Any, connection: Optional["DuckDBConnection"] = None, **kwargs: Any
+    ) -> "DMLResultDict":
+        conn = self._connection(connection)
+        param_list = param_list or []
+        # DuckDB throws an error if executemany is called with empty parameter list
+        if not param_list:
+            return {"rows_affected": 0}
+        with self._get_cursor(conn) as cursor:
+            cursor.executemany(sql, param_list)
+            # DuckDB returns -1 for rowcount on DML operations
+            # For executemany, fetchone() only returns the count from the last operation,
+            # so use parameter list length as the most accurate estimate
+            rows_affected = cursor.rowcount if cursor.rowcount >= 0 else len(param_list)
+            return {"rows_affected": rows_affected}
+    def _execute_script(
+        self, script: str, connection: Optional["DuckDBConnection"] = None, **kwargs: Any
+    ) -> "ScriptResultDict":
+        conn = self._connection(connection)
+        with self._get_cursor(conn) as cursor:
+            cursor.execute(script)
+        return {
+            "statements_executed": -1,
+            "status_message": "Script executed successfully.",
+            "description": "The script was sent to the database.",
+        }
+    def _wrap_select_result(
+        self, statement: SQL, result: "SelectResultDict", schema_type: Optional[type[ModelDTOT]] = None, **kwargs: Any
+    ) -> Union[SQLResult[ModelDTOT], SQLResult[RowT]]:
+        fetched_tuples = result["data"]
+        column_names = result["column_names"]
+        rows_affected = result["rows_affected"]
+        rows_as_dicts: list[dict[str, Any]] = [dict(zip(column_names, row)) for row in fetched_tuples]
+        logger.debug("Query returned %d rows", len(rows_as_dicts))
+        if schema_type:
+            converted_data = self.to_schema(data=rows_as_dicts, schema_type=schema_type)
+            return SQLResult[ModelDTOT](
+                statement=statement,
+                data=list(converted_data),
+                column_names=column_names,
+                rows_affected=rows_affected,
+                operation_type="SELECT",
+            )
+        return SQLResult[RowT](
+            statement=statement,
+            data=rows_as_dicts,
+            column_names=column_names,
+            rows_affected=rows_affected,
+            operation_type="SELECT",
+        )
+    def _wrap_execute_result(
+        self, statement: SQL, result: "Union[DMLResultDict, ScriptResultDict]", **kwargs: Any
+    ) -> SQLResult[RowT]:
+        operation_type = "UNKNOWN"
+        if statement.expression:
+            operation_type = str(statement.expression.key).upper()
+        if "statements_executed" in result:
+            script_result = cast("ScriptResultDict", result)
+            return SQLResult[RowT](
+                statement=statement,
+                data=[],
+                rows_affected=0,
+                operation_type=operation_type or "SCRIPT",
+                metadata={"status_message": script_result.get("status_message", "")},
+            )
+        dml_result = cast("DMLResultDict", result)
+        rows_affected = dml_result.get("rows_affected", -1)
+        status_message = dml_result.get("status_message", "")
+        return SQLResult[RowT](
+            statement=statement,
+            data=[],
+            rows_affected=rows_affected,
+            operation_type=operation_type,
+            metadata={"status_message": status_message},
+        )
+    # ============================================================================
+    # DuckDB Native Arrow Support
+    # ============================================================================
+    def _fetch_arrow_table(self, sql: SQL, connection: "Optional[Any]" = None, **kwargs: Any) -> "ArrowResult":
+        """Enhanced DuckDB native Arrow table fetching with streaming support."""
+        conn = self._connection(connection)
+        sql_string, parameters = sql.compile(placeholder_style=self.default_parameter_style)
+        parameters = self._process_parameters(parameters)
+        result = conn.execute(sql_string, parameters or [])
+        batch_size = kwargs.get("batch_size")
+        if batch_size:
+            arrow_reader = result.fetch_record_batch(batch_size)
+            import pyarrow as pa
+            batches = list(arrow_reader)
+            arrow_table = pa.Table.from_batches(batches) if batches else pa.table({})
+            logger.debug("Fetched Arrow table (streaming) with %d rows", arrow_table.num_rows)
+        else:
+            arrow_table = result.arrow()
+            logger.debug("Fetched Arrow table (zero-copy) with %d rows", arrow_table.num_rows)
+        return ArrowResult(statement=sql, data=arrow_table)
+    # ============================================================================
+    # DuckDB Native Storage Operations (Override base implementations)
+    # ============================================================================
+    def _has_native_capability(self, operation: str, uri: str = "", format: str = "") -> bool:
+        if format:
+            format_lower = format.lower()
+            if operation == "export" and format_lower in {"parquet", "csv", "json"}:
+                return True
+            if operation == "import" and format_lower in {"parquet", "csv", "json"}:
+                return True
+            if operation == "read" and format_lower == "parquet":
+                return True
+        return False
+    def _export_native(self, query: str, destination_uri: str, format: str, **options: Any) -> int:
+        conn = self._connection(None)
+        copy_options: list[str] = []
+        if format.lower() == "parquet":
+            copy_options.append("FORMAT PARQUET")
+            if "compression" in options:
+                copy_options.append(f"COMPRESSION '{options['compression'].upper()}'")
+            if "row_group_size" in options:
+                copy_options.append(f"ROW_GROUP_SIZE {options['row_group_size']}")
+            if "partition_by" in options:
+                partition_cols = (
+                    [options["partition_by"]] if isinstance(options["partition_by"], str) else options["partition_by"]
+                )
+                copy_options.append(f"PARTITION_BY ({', '.join(partition_cols)})")
+        elif format.lower() == "csv":
+            copy_options.extend(("FORMAT CSV", "HEADER"))
+            if "compression" in options:
+                copy_options.append(f"COMPRESSION '{options['compression'].upper()}'")
+            if "delimiter" in options:
+                copy_options.append(f"DELIMITER '{options['delimiter']}'")
+            if "quote" in options:
+                copy_options.append(f"QUOTE '{options['quote']}'")
+        elif format.lower() == "json":
+            copy_options.append("FORMAT JSON")
+            if "compression" in options:
+                copy_options.append(f"COMPRESSION '{options['compression'].upper()}'")
+        else:
+            msg = f"Unsupported format for DuckDB native export: {format}"
+            raise ValueError(msg)
+        options_str = f"({', '.join(copy_options)})" if copy_options else ""
+        copy_sql = f"COPY ({query}) TO '{destination_uri}' {options_str}"
+        result_rel = conn.execute(copy_sql)
+        result = result_rel.fetchone() if result_rel else None
+        return result[0] if result else 0
+    def _import_native(self, source_uri: str, table_name: str, format: str, mode: str, **options: Any) -> int:
+        conn = self._connection(None)
+        if format == "parquet":
+            read_func = f"read_parquet('{source_uri}')"
+        elif format == "csv":
+            read_func = f"read_csv_auto('{source_uri}')"
+        elif format == "json":
+            read_func = f"read_json_auto('{source_uri}')"
+        else:
+            msg = f"Unsupported format for DuckDB native import: {format}"
+            raise ValueError(msg)
+        if mode == "create":
+            sql = f"CREATE TABLE {table_name} AS SELECT * FROM {read_func}"
+        elif mode == "replace":
+            sql = f"CREATE OR REPLACE TABLE {table_name} AS SELECT * FROM {read_func}"
+        elif mode == "append":
+            sql = f"INSERT INTO {table_name} SELECT * FROM {read_func}"
+        else:
+            msg = f"Unsupported import mode: {mode}"
+            raise ValueError(msg)
+        result_rel = conn.execute(sql)
+        result = result_rel.fetchone() if result_rel else None
+        if result:
+            return int(result[0])
+        count_result_rel = conn.execute(f"SELECT COUNT(*) FROM {table_name}")
+        count_result = count_result_rel.fetchone() if count_result_rel else None
+        return int(count_result[0]) if count_result else 0
+    def _read_parquet_native(
+        self, source_uri: str, columns: Optional[list[str]] = None, **options: Any
+    ) -> "SQLResult[dict[str, Any]]":
+        conn = self._connection(None)
+        if isinstance(source_uri, list):
+            file_list = "[" + ", ".join(f"'{f}'" for f in source_uri) + "]"
+            read_func = f"read_parquet({file_list})"
+        elif "*" in source_uri or "?" in source_uri:
+            read_func = f"read_parquet('{source_uri}')"
+        else:
+            read_func = f"read_parquet('{source_uri}')"
+        column_list = ", ".join(columns) if columns else "*"
+        query = f"SELECT {column_list} FROM {read_func}"
+        filters = options.get("filters")
+        if filters:
+            where_clauses = []
+            for col, op, val in filters:
+                where_clauses.append(f"'{col}' {op} '{val}'" if isinstance(val, str) else f"'{col}' {op} {val}")
+            if where_clauses:
+                query += " WHERE " + " AND ".join(where_clauses)
+        arrow_table = conn.execute(query).arrow()
+        arrow_dict = arrow_table.to_pydict()
+        column_names = arrow_table.column_names
+        num_rows = arrow_table.num_rows
+        rows = [{col: arrow_dict[col][i] for col in column_names} for i in range(num_rows)]
+        return SQLResult[dict[str, Any]](
+            statement=SQL(query), data=rows, column_names=column_names, rows_affected=num_rows, operation_type="SELECT"
+        )
+    def _write_parquet_native(self, data: Union[str, "ArrowTable"], destination_uri: str, **options: Any) -> None:
+        conn = self._connection(None)
+        copy_options: list[str] = ["FORMAT PARQUET"]
+        if "compression" in options:
+            copy_options.append(f"COMPRESSION '{options['compression'].upper()}'")
+        if "row_group_size" in options:
+            copy_options.append(f"ROW_GROUP_SIZE {options['row_group_size']}")
+        options_str = f"({', '.join(copy_options)})"
+        if isinstance(data, str):
+            copy_sql = f"COPY ({data}) TO '{destination_uri}' {options_str}"
+            conn.execute(copy_sql)
+        else:
+            temp_name = f"_arrow_data_{uuid.uuid4().hex[:8]}"
+            conn.register(temp_name, data)
             try:
-                yield cursor
+                copy_sql = f"COPY {temp_name} TO '{destination_uri}' {options_str}"
+                conn.execute(copy_sql)
             finally:
-                cursor.close()
-        else:
-            yield connection
-    def _process_sql_params(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        **kwargs: Any,
-    ) -> "tuple[str, Optional[Union[tuple[Any, ...], list[Any], dict[str, Any]]]]":
-        """Process SQL and parameters for DuckDB using SQLStatement.
-        DuckDB supports both named (:name, $name) and positional (?) parameters.
-        This method processes the SQL with dialect-aware parsing and handles
-        parameters appropriately for DuckDB.
-        Args:
-            sql: SQL statement.
-            parameters: Query parameters.
-            *filters: Statement filters to apply.
-            **kwargs: Additional keyword arguments.
-        Returns:
-            Tuple of processed SQL and parameters.
-        """
-        data_params_for_statement: Optional[Union[Mapping[str, Any], Sequence[Any]]] = None
-        combined_filters_list: list[StatementFilter] = list(filters)
-        if parameters is not None:
-            if isinstance(parameters, StatementFilter):
-                combined_filters_list.insert(0, parameters)
+                with contextlib.suppress(Exception):
+                    conn.unregister(temp_name)
+    def _ingest_arrow_table(self, table: "ArrowTable", table_name: str, mode: str = "create", **options: Any) -> int:
+        """DuckDB-optimized Arrow table ingestion using native registration."""
+        self._ensure_pyarrow_installed()
+        conn = self._connection(None)
+        temp_name = f"_arrow_temp_{uuid.uuid4().hex[:8]}"
+        try:
+            conn.register(temp_name, table)
+            if mode == "create":
+                sql_expr = exp.Create(
+                    this=exp.to_table(table_name), expression=exp.Select().from_(temp_name).select("*"), kind="TABLE"
+                )
+            elif mode == "append":
+                sql_expr = exp.Insert(  # type: ignore[assignment]
+                    this=exp.to_table(table_name), expression=exp.Select().from_(temp_name).select("*")
+                )
+            elif mode == "replace":
+                sql_expr = exp.Create(
+                    this=exp.to_table(table_name),
+                    expression=exp.Select().from_(temp_name).select("*"),
+                    kind="TABLE",
+                    replace=True,
+                )
             else:
-                data_params_for_statement = parameters
-        if data_params_for_statement is not None and not isinstance(data_params_for_statement, (list, tuple, dict)):
-            data_params_for_statement = (data_params_for_statement,)
-        statement = SQLStatement(sql, data_params_for_statement, kwargs=kwargs, dialect=self.dialect)
-        for filter_obj in combined_filters_list:
-            statement = statement.apply_filter(filter_obj)
-        processed_sql, processed_params, _ = statement.process()
-        if processed_params is None:
-            return processed_sql, None
-        if isinstance(processed_params, dict):
-            return processed_sql, processed_params
-        if isinstance(processed_params, (list, tuple)):
-            return processed_sql, tuple(processed_params)
-        return processed_sql, (processed_params,)  # type: ignore[unreachable]
-    # --- Public API Methods --- #
-    @overload
-    def select(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: None = None,
-        **kwargs: Any,
-    ) -> "Sequence[dict[str, Any]]": ...
-    @overload
-    def select(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "type[ModelDTOT]",
-        **kwargs: Any,
-    ) -> "Sequence[ModelDTOT]": ...
-    def select(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "Optional[type[ModelDTOT]]" = None,
-        **kwargs: Any,
-    ) -> "Sequence[Union[dict[str, Any], ModelDTOT]]":
-        """Fetch data from the database.
-        Returns:
-            List of row data as either model instances or dictionaries.
-        """
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            cursor.execute(sql, [] if parameters is None else parameters)
-            results = cursor.fetchall()
-            if not results:
-                return []
-            column_names = [column[0] for column in cursor.description or []]
-            return self.to_schema([dict(zip(column_names, row)) for row in results], schema_type=schema_type)
-    @overload
-    def select_one(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: None = None,
-        **kwargs: Any,
-    ) -> "dict[str, Any]": ...
-    @overload
-    def select_one(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "type[ModelDTOT]",
-        **kwargs: Any,
-    ) -> "ModelDTOT": ...
-    def select_one(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "Optional[type[ModelDTOT]]" = None,
-        **kwargs: Any,
-    ) -> "Union[dict[str, Any], ModelDTOT]":
-        """Fetch one row from the database.
-        Returns:
-            The first row of the query results.
-        """
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            cursor.execute(sql, [] if parameters is None else parameters)
-            result = cursor.fetchone()
-            result = self.check_not_found(result)
-            column_names = [column[0] for column in cursor.description or []]
-            return self.to_schema(dict(zip(column_names, result)), schema_type=schema_type)
-    @overload
-    def select_one_or_none(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: None = None,
-        **kwargs: Any,
-    ) -> "Optional[dict[str, Any]]": ...
-    @overload
-    def select_one_or_none(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "type[ModelDTOT]",
-        **kwargs: Any,
-    ) -> "Optional[ModelDTOT]": ...
-    def select_one_or_none(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "Optional[type[ModelDTOT]]" = None,
-        **kwargs: Any,
-    ) -> "Optional[Union[dict[str, Any], ModelDTOT]]":
-        """Fetch one row from the database.
-        Returns:
-            The first row of the query results, or None if no results.
-        """
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            cursor.execute(sql, [] if parameters is None else parameters)
-            result = cursor.fetchone()
-            if result is None:
-                return None
-            column_names = [column[0] for column in cursor.description or []]
-            return self.to_schema(dict(zip(column_names, result)), schema_type=schema_type)
-    @overload
-    def select_value(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: None = None,
-        **kwargs: Any,
-    ) -> "Any": ...
-    @overload
-    def select_value(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "type[T]",
-        **kwargs: Any,
-    ) -> "T": ...
-    def select_value(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "Optional[type[T]]" = None,
-        **kwargs: Any,
-    ) -> "Union[T, Any]":
-        """Fetch a single value from the database.
-        Returns:
-            The first value from the first row of results.
-        """
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            cursor.execute(sql, [] if parameters is None else parameters)
-            result = cursor.fetchone()
-            result = self.check_not_found(result)
-            result_value = result[0]
-            if schema_type is None:
-                return result_value
-            return schema_type(result_value)  # type: ignore[call-arg]
-    @overload
-    def select_value_or_none(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: None = None,
-        **kwargs: Any,
-    ) -> "Optional[Any]": ...
-    @overload
-    def select_value_or_none(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "type[T]",
-        **kwargs: Any,
-    ) -> "Optional[T]": ...
-    def select_value_or_none(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "Optional[type[T]]" = None,
-        **kwargs: Any,
-    ) -> "Optional[Union[T, Any]]":
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            cursor.execute(sql, [] if parameters is None else parameters)
-            result = cursor.fetchone()
-            if result is None:
-                return None
-            if schema_type is None:
-                return result[0]
-            return schema_type(result[0])  # type: ignore[call-arg]
-    def insert_update_delete(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        **kwargs: Any,
-    ) -> int:
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            params = [] if parameters is None else parameters
-            cursor.execute(sql, params)
-            return getattr(cursor, "rowcount", -1)
-    @overload
-    def insert_update_delete_returning(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: None = None,
-        **kwargs: Any,
-    ) -> "dict[str, Any]": ...
-    @overload
-    def insert_update_delete_returning(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "type[ModelDTOT]",
-        **kwargs: Any,
-    ) -> "ModelDTOT": ...
-    def insert_update_delete_returning(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        schema_type: "Optional[type[ModelDTOT]]" = None,
-        **kwargs: Any,
-    ) -> "Union[ModelDTOT, dict[str, Any]]":
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            params = [] if parameters is None else parameters
-            cursor.execute(sql, params)
-            result = cursor.fetchall()
-            result = self.check_not_found(result)
-            column_names = [col[0] for col in cursor.description or []]
-            return self.to_schema(dict(zip(column_names, result[0])), schema_type=schema_type)
-    def execute_script(
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        connection: "Optional[DuckDBConnection]" = None,
-        **kwargs: Any,
-    ) -> str:
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            params = [] if parameters is None else parameters
-            cursor.execute(sql, params)
-            return cast("str", getattr(cursor, "statusmessage", "DONE"))
-    # --- Arrow Bulk Operations ---
-    def select_arrow(  # pyright: ignore[reportUnknownParameterType]
-        self,
-        sql: str,
-        parameters: "Optional[StatementParameterType]" = None,
-        *filters: "StatementFilter",
-        connection: "Optional[DuckDBConnection]" = None,
-        **kwargs: Any,
-    ) -> "ArrowTable":
-        """Execute a SQL query and return results as an Apache Arrow Table.
-        Args:
-            sql: The SQL query string.
-            parameters: Parameters for the query.
-            *filters: Optional filters to apply to the SQL statement.
-            connection: Optional connection override.
-            **kwargs: Additional keyword arguments to merge with parameters if parameters is a dict.
-        Returns:
-            An Apache Arrow Table containing the query results.
-        """
-        connection = self._connection(connection)
-        sql, parameters = self._process_sql_params(sql, parameters, *filters, **kwargs)
-        with self._with_cursor(connection) as cursor:
-            params = [] if parameters is None else parameters
-            cursor.execute(sql, params)
-            return cast("ArrowTable", cursor.fetch_arrow_table())
-    def _connection(self, connection: "Optional[DuckDBConnection]" = None) -> "DuckDBConnection":
-        """Get the connection to use for the operation.
-        Args:
-            connection: Optional connection to use.
-        Returns:
-            The connection to use.
-        """
-        return connection or self.connection
+                msg = f"Unsupported mode: {mode}"
+                raise ValueError(msg)
+            result = self.execute(SQL(sql_expr.sql(dialect=self.dialect)))
+            return result.rows_affected or table.num_rows
+        finally:
+            with contextlib.suppress(Exception):
+                conn.unregister(temp_name)

sqlspec 0.11.1__py3-none-any.whl → 0.12.1__py3-none-any.whl

Potentially problematic release.

sqlspec 0.11.1py3-none-any.whl → 0.12.1py3-none-any.whl