PyPI - sqlmesh - Versions diffs - 0.217.1.dev1__py3-none-any.whl → 0.227.2.dev20__py3-none-any.whl - Mend

sqlmesh 0.217.1.dev1py3-none-any.whl → 0.227.2.dev20py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (190) hide show

sqlmesh/__init__.py +12 -2
sqlmesh/_version.py +2 -2
sqlmesh/cli/project_init.py +10 -2
sqlmesh/core/_typing.py +1 -0
sqlmesh/core/audit/definition.py +8 -2
sqlmesh/core/config/__init__.py +1 -1
sqlmesh/core/config/connection.py +20 -5
sqlmesh/core/config/dbt.py +13 -0
sqlmesh/core/config/janitor.py +12 -0
sqlmesh/core/config/loader.py +7 -0
sqlmesh/core/config/model.py +2 -0
sqlmesh/core/config/root.py +3 -0
sqlmesh/core/console.py +80 -2
sqlmesh/core/constants.py +1 -1
sqlmesh/core/context.py +112 -35
sqlmesh/core/dialect.py +3 -0
sqlmesh/core/engine_adapter/_typing.py +2 -0
sqlmesh/core/engine_adapter/base.py +330 -23
sqlmesh/core/engine_adapter/base_postgres.py +17 -1
sqlmesh/core/engine_adapter/bigquery.py +146 -7
sqlmesh/core/engine_adapter/clickhouse.py +17 -13
sqlmesh/core/engine_adapter/databricks.py +50 -2
sqlmesh/core/engine_adapter/fabric.py +110 -29
sqlmesh/core/engine_adapter/mixins.py +142 -48
sqlmesh/core/engine_adapter/mssql.py +15 -4
sqlmesh/core/engine_adapter/mysql.py +2 -2
sqlmesh/core/engine_adapter/postgres.py +9 -3
sqlmesh/core/engine_adapter/redshift.py +4 -0
sqlmesh/core/engine_adapter/risingwave.py +1 -0
sqlmesh/core/engine_adapter/shared.py +6 -0
sqlmesh/core/engine_adapter/snowflake.py +82 -11
sqlmesh/core/engine_adapter/spark.py +14 -10
sqlmesh/core/engine_adapter/trino.py +5 -2
sqlmesh/core/janitor.py +181 -0
sqlmesh/core/lineage.py +1 -0
sqlmesh/core/linter/rules/builtin.py +15 -0
sqlmesh/core/loader.py +17 -30
sqlmesh/core/macros.py +35 -13
sqlmesh/core/model/common.py +2 -0
sqlmesh/core/model/definition.py +72 -4
sqlmesh/core/model/kind.py +66 -2
sqlmesh/core/model/meta.py +107 -2
sqlmesh/core/node.py +101 -2
sqlmesh/core/plan/builder.py +15 -10
sqlmesh/core/plan/common.py +196 -2
sqlmesh/core/plan/definition.py +21 -6
sqlmesh/core/plan/evaluator.py +72 -113
sqlmesh/core/plan/explainer.py +90 -8
sqlmesh/core/plan/stages.py +42 -21
sqlmesh/core/renderer.py +26 -18
sqlmesh/core/scheduler.py +60 -19
sqlmesh/core/selector.py +137 -9
sqlmesh/core/signal.py +64 -1
sqlmesh/core/snapshot/__init__.py +1 -0
sqlmesh/core/snapshot/definition.py +109 -25
sqlmesh/core/snapshot/evaluator.py +610 -50
sqlmesh/core/state_sync/__init__.py +0 -1
sqlmesh/core/state_sync/base.py +31 -27
sqlmesh/core/state_sync/cache.py +12 -4
sqlmesh/core/state_sync/common.py +216 -111
sqlmesh/core/state_sync/db/facade.py +30 -15
sqlmesh/core/state_sync/db/interval.py +27 -7
sqlmesh/core/state_sync/db/migrator.py +14 -8
sqlmesh/core/state_sync/db/snapshot.py +119 -87
sqlmesh/core/table_diff.py +2 -2
sqlmesh/core/test/definition.py +14 -9
sqlmesh/core/test/discovery.py +4 -0
sqlmesh/dbt/adapter.py +20 -11
sqlmesh/dbt/basemodel.py +52 -41
sqlmesh/dbt/builtin.py +27 -11
sqlmesh/dbt/column.py +17 -5
sqlmesh/dbt/common.py +4 -2
sqlmesh/dbt/context.py +14 -1
sqlmesh/dbt/loader.py +60 -8
sqlmesh/dbt/manifest.py +136 -8
sqlmesh/dbt/model.py +105 -25
sqlmesh/dbt/package.py +16 -1
sqlmesh/dbt/profile.py +3 -3
sqlmesh/dbt/project.py +12 -7
sqlmesh/dbt/seed.py +1 -1
sqlmesh/dbt/source.py +6 -1
sqlmesh/dbt/target.py +25 -6
sqlmesh/dbt/test.py +31 -1
sqlmesh/integrations/github/cicd/controller.py +6 -2
sqlmesh/lsp/context.py +4 -2
sqlmesh/magics.py +1 -1
sqlmesh/migrations/v0000_baseline.py +3 -6
sqlmesh/migrations/v0061_mysql_fix_blob_text_type.py +2 -5
sqlmesh/migrations/v0062_add_model_gateway.py +2 -2
sqlmesh/migrations/v0063_change_signals.py +2 -4
sqlmesh/migrations/v0064_join_when_matched_strings.py +2 -4
sqlmesh/migrations/v0065_add_model_optimize.py +2 -2
sqlmesh/migrations/v0066_add_auto_restatements.py +2 -6
sqlmesh/migrations/v0067_add_tsql_date_full_precision.py +2 -2
sqlmesh/migrations/v0068_include_unrendered_query_in_metadata_hash.py +2 -2
sqlmesh/migrations/v0069_update_dev_table_suffix.py +2 -4
sqlmesh/migrations/v0070_include_grains_in_metadata_hash.py +2 -2
sqlmesh/migrations/v0071_add_dev_version_to_intervals.py +2 -6
sqlmesh/migrations/v0072_add_environment_statements.py +2 -4
sqlmesh/migrations/v0073_remove_symbolic_disable_restatement.py +2 -4
sqlmesh/migrations/v0074_add_partition_by_time_column_property.py +2 -2
sqlmesh/migrations/v0075_remove_validate_query.py +2 -4
sqlmesh/migrations/v0076_add_cron_tz.py +2 -2
sqlmesh/migrations/v0077_fix_column_type_hash_calculation.py +2 -2
sqlmesh/migrations/v0078_warn_if_non_migratable_python_env.py +2 -4
sqlmesh/migrations/v0079_add_gateway_managed_property.py +7 -9
sqlmesh/migrations/v0080_add_batch_size_to_scd_type_2_models.py +2 -2
sqlmesh/migrations/v0081_update_partitioned_by.py +2 -4
sqlmesh/migrations/v0082_warn_if_incorrectly_duplicated_statements.py +2 -4
sqlmesh/migrations/v0083_use_sql_for_scd_time_data_type_data_hash.py +2 -2
sqlmesh/migrations/v0084_normalize_quote_when_matched_and_merge_filter.py +2 -2
sqlmesh/migrations/v0085_deterministic_repr.py +2 -4
sqlmesh/migrations/v0086_check_deterministic_bug.py +2 -4
sqlmesh/migrations/v0087_normalize_blueprint_variables.py +2 -4
sqlmesh/migrations/v0088_warn_about_variable_python_env_diffs.py +2 -4
sqlmesh/migrations/v0089_add_virtual_environment_mode.py +2 -2
sqlmesh/migrations/v0090_add_forward_only_column.py +2 -6
sqlmesh/migrations/v0091_on_additive_change.py +2 -2
sqlmesh/migrations/v0092_warn_about_dbt_data_type_diff.py +2 -4
sqlmesh/migrations/v0093_use_raw_sql_in_fingerprint.py +2 -2
sqlmesh/migrations/v0094_add_dev_version_and_fingerprint_columns.py +2 -6
sqlmesh/migrations/v0095_warn_about_dbt_raw_sql_diff.py +2 -4
sqlmesh/migrations/v0096_remove_plan_dags_table.py +2 -4
sqlmesh/migrations/v0097_add_dbt_name_in_node.py +2 -2
sqlmesh/migrations/v0098_add_dbt_node_info_in_node.py +103 -0
sqlmesh/migrations/v0099_add_last_altered_to_intervals.py +25 -0
sqlmesh/migrations/v0100_add_grants_and_grants_target_layer.py +9 -0
sqlmesh/utils/__init__.py +8 -1
sqlmesh/utils/cache.py +5 -1
sqlmesh/utils/date.py +1 -1
sqlmesh/utils/errors.py +4 -0
sqlmesh/utils/git.py +3 -1
sqlmesh/utils/jinja.py +25 -2
sqlmesh/utils/pydantic.py +6 -6
sqlmesh/utils/windows.py +13 -3
{sqlmesh-0.217.1.dev1.dist-info → sqlmesh-0.227.2.dev20.dist-info}/METADATA +5 -5
{sqlmesh-0.217.1.dev1.dist-info → sqlmesh-0.227.2.dev20.dist-info}/RECORD +188 -183
sqlmesh_dbt/cli.py +70 -7
sqlmesh_dbt/console.py +14 -6
sqlmesh_dbt/operations.py +103 -24
sqlmesh_dbt/selectors.py +39 -1
web/client/dist/assets/{Audits-Ucsx1GzF.js → Audits-CBiYyyx-.js} +1 -1
web/client/dist/assets/{Banner-BWDzvavM.js → Banner-DSRbUlO5.js} +1 -1
web/client/dist/assets/{ChevronDownIcon-D2VL13Ah.js → ChevronDownIcon-MK_nrjD_.js} +1 -1
web/client/dist/assets/{ChevronRightIcon-DWGYbf1l.js → ChevronRightIcon-CLWtT22Q.js} +1 -1
web/client/dist/assets/{Content-DdHDZM3I.js → Content-BNuGZN5l.js} +1 -1
web/client/dist/assets/{Content-Bikfy8fh.js → Content-CSHJyW0n.js} +1 -1
web/client/dist/assets/{Data-CzAJH7rW.js → Data-C1oRDbLx.js} +1 -1
web/client/dist/assets/{DataCatalog-BJF11g8f.js → DataCatalog-HXyX2-_j.js} +1 -1
web/client/dist/assets/{Editor-s0SBpV2y.js → Editor-BDyfpUuw.js} +1 -1
web/client/dist/assets/{Editor-DgLhgKnm.js → Editor-D0jNItwC.js} +1 -1
web/client/dist/assets/{Errors-D0m0O1d3.js → Errors-BfuFLcPi.js} +1 -1
web/client/dist/assets/{FileExplorer-CEv0vXkt.js → FileExplorer-BR9IE3he.js} +1 -1
web/client/dist/assets/{Footer-BwzXn8Ew.js → Footer-CgBEtiAh.js} +1 -1
web/client/dist/assets/{Header-6heDkEqG.js → Header-DSqR6nSO.js} +1 -1
web/client/dist/assets/{Input-obuJsD6k.js → Input-B-oZ6fGO.js} +1 -1
web/client/dist/assets/Lineage-DYQVwDbD.js +1 -0
web/client/dist/assets/{ListboxShow-HM9_qyrt.js → ListboxShow-BE5-xevs.js} +1 -1
web/client/dist/assets/{ModelLineage-zWdKo0U2.js → ModelLineage-DkIFAYo4.js} +1 -1
web/client/dist/assets/{Models-Bcu66SRz.js → Models-D5dWr8RB.js} +1 -1
web/client/dist/assets/{Page-BWEEQfIt.js → Page-C-XfU5BR.js} +1 -1
web/client/dist/assets/{Plan-C4gXCqlf.js → Plan-ZEuTINBq.js} +1 -1
web/client/dist/assets/{PlusCircleIcon-CVDO651q.js → PlusCircleIcon-DVXAHG8_.js} +1 -1
web/client/dist/assets/{ReportErrors-BT6xFwAr.js → ReportErrors-B7FEPzMB.js} +1 -1
web/client/dist/assets/{Root-ryJoBK4h.js → Root-8aZyhPxF.js} +1 -1
web/client/dist/assets/{SearchList-DB04sPb9.js → SearchList-W_iT2G82.js} +1 -1
web/client/dist/assets/{SelectEnvironment-CUYcXUu6.js → SelectEnvironment-C65jALmO.js} +1 -1
web/client/dist/assets/{SourceList-Doo_9ZGp.js → SourceList-DSLO6nVJ.js} +1 -1
web/client/dist/assets/{SourceListItem-D5Mj7Dly.js → SourceListItem-BHt8d9-I.js} +1 -1
web/client/dist/assets/{SplitPane-qHmkD1qy.js → SplitPane-CViaZmw6.js} +1 -1
web/client/dist/assets/{Tests-DH1Z74ML.js → Tests-DhaVt5t1.js} +1 -1
web/client/dist/assets/{Welcome-DqUJUNMF.js → Welcome-DvpjH-_4.js} +1 -1
web/client/dist/assets/context-BctCsyGb.js +71 -0
web/client/dist/assets/{context-Dr54UHLi.js → context-DFNeGsFF.js} +1 -1
web/client/dist/assets/{editor-DYIP1yQ4.js → editor-CcO28cqd.js} +1 -1
web/client/dist/assets/{file-DarlIDVi.js → file-CvJN3aZO.js} +1 -1
web/client/dist/assets/{floating-ui.react-dom-BH3TFvkM.js → floating-ui.react-dom-CjE-JNW1.js} +1 -1
web/client/dist/assets/{help-Bl8wqaQc.js → help-DuPhjipa.js} +1 -1
web/client/dist/assets/{index-D1sR7wpN.js → index-C-dJH7yZ.js} +1 -1
web/client/dist/assets/{index-O3mjYpnE.js → index-Dj0i1-CA.js} +2 -2
web/client/dist/assets/{plan-CehRrJUG.js → plan-BTRSbjKn.js} +1 -1
web/client/dist/assets/{popover-CqgMRE0G.js → popover-_Sf0yvOI.js} +1 -1
web/client/dist/assets/{project-6gxepOhm.js → project-BvSOI8MY.js} +1 -1
web/client/dist/index.html +1 -1
web/client/dist/assets/Lineage-D0Hgdz2v.js +0 -1
web/client/dist/assets/context-DgX0fp2E.js +0 -68
{sqlmesh-0.217.1.dev1.dist-info → sqlmesh-0.227.2.dev20.dist-info}/WHEEL +0 -0
{sqlmesh-0.217.1.dev1.dist-info → sqlmesh-0.227.2.dev20.dist-info}/entry_points.txt +0 -0
{sqlmesh-0.217.1.dev1.dist-info → sqlmesh-0.227.2.dev20.dist-info}/licenses/LICENSE +0 -0
{sqlmesh-0.217.1.dev1.dist-info → sqlmesh-0.227.2.dev20.dist-info}/top_level.txt +0 -0

sqlmesh/core/state_sync/db/interval.py CHANGED Viewed

@@ -15,10 +15,10 @@ from sqlmesh.core.state_sync.db.utils import (
 from sqlmesh.core.snapshot import (
     SnapshotIntervals,
     SnapshotIdLike,
+    SnapshotIdAndVersionLike,
     SnapshotNameVersionLike,
     SnapshotTableCleanupTask,
     SnapshotNameVersion,
-    SnapshotInfoLike,
     Snapshot,
 )
 from sqlmesh.core.snapshot.definition import Interval
@@ -60,6 +60,7 @@ class IntervalState:
             "is_removed": exp.DataType.build("boolean"),
             "is_compacted": exp.DataType.build("boolean"),
             "is_pending_restatement": exp.DataType.build("boolean"),
+            "last_altered_ts": exp.DataType.build("bigint"),
         }
     def add_snapshots_intervals(self, snapshots_intervals: t.Sequence[SnapshotIntervals]) -> None:
@@ -68,11 +69,11 @@ class IntervalState:
     def remove_intervals(
         self,
-        snapshot_intervals: t.Sequence[t.Tuple[SnapshotInfoLike, Interval]],
+        snapshot_intervals: t.Sequence[t.Tuple[SnapshotIdAndVersionLike, Interval]],
         remove_shared_versions: bool = False,
     ) -> None:
         intervals_to_remove: t.Sequence[
-            t.Tuple[t.Union[SnapshotInfoLike, SnapshotIntervals], Interval]
+            t.Tuple[t.Union[SnapshotIdAndVersionLike, SnapshotIntervals], Interval]
         ] = snapshot_intervals
         if remove_shared_versions:
             name_version_mapping = {s.name_version: interval for s, interval in snapshot_intervals}
@@ -215,13 +216,23 @@ class IntervalState:
             for start_ts, end_ts in snapshot.intervals:
                 new_intervals.append(
                     _interval_to_df(
-                        snapshot, start_ts, end_ts, is_dev=False, is_compacted=is_compacted
+                        snapshot,
+                        start_ts,
+                        end_ts,
+                        is_dev=False,
+                        is_compacted=is_compacted,
+                        last_altered_ts=snapshot.last_altered_ts,
                     )
                 )
             for start_ts, end_ts in snapshot.dev_intervals:
                 new_intervals.append(
                     _interval_to_df(
-                        snapshot, start_ts, end_ts, is_dev=True, is_compacted=is_compacted
+                        snapshot,
+                        start_ts,
+                        end_ts,
+                        is_dev=True,
+                        is_compacted=is_compacted,
+                        last_altered_ts=snapshot.dev_last_altered_ts,
                     )
                 )
@@ -236,6 +247,7 @@ class IntervalState:
                         is_dev=False,
                         is_compacted=is_compacted,
                         is_pending_restatement=True,
+                        last_altered_ts=snapshot.last_altered_ts,
                     )
                 )
@@ -284,6 +296,7 @@ class IntervalState:
                 is_dev,
                 is_removed,
                 is_pending_restatement,
+                last_altered_ts,
             ) in rows:
                 interval_ids.add(interval_id)
                 merge_key = (name, version, dev_version, identifier)
@@ -318,8 +331,10 @@ class IntervalState:
                 else:
                     if is_dev:
                         intervals[merge_key].add_dev_interval(start, end)
+                        intervals[merge_key].update_dev_last_altered_ts(last_altered_ts)
                     else:
                         intervals[merge_key].add_interval(start, end)
+                        intervals[merge_key].update_last_altered_ts(last_altered_ts)
                         # Remove all pending restatement intervals recorded before the current interval has been added
                         intervals[
                             pending_restatement_interval_merge_key
@@ -340,6 +355,7 @@ class IntervalState:
                 "is_dev",
                 "is_removed",
                 "is_pending_restatement",
+                "last_altered_ts",
             )
             .from_(exp.to_table(self.intervals_table).as_("intervals"))
             .order_by(
@@ -431,7 +447,9 @@ class IntervalState:
 def _intervals_to_df(
-    snapshot_intervals: t.Sequence[t.Tuple[t.Union[SnapshotInfoLike, SnapshotIntervals], Interval]],
+    snapshot_intervals: t.Sequence[
+        t.Tuple[t.Union[SnapshotIdAndVersionLike, SnapshotIntervals], Interval]
+    ],
     is_dev: bool,
     is_removed: bool,
 ) -> pd.DataFrame:
@@ -451,13 +469,14 @@ def _intervals_to_df(
 def _interval_to_df(
-    snapshot: t.Union[SnapshotInfoLike, SnapshotIntervals],
+    snapshot: t.Union[SnapshotIdAndVersionLike, SnapshotIntervals],
     start_ts: int,
     end_ts: int,
     is_dev: bool = False,
     is_removed: bool = False,
     is_compacted: bool = False,
     is_pending_restatement: bool = False,
+    last_altered_ts: t.Optional[int] = None,
 ) -> t.Dict[str, t.Any]:
     return {
         "id": random_id(),
@@ -472,4 +491,5 @@ def _interval_to_df(
         "is_removed": is_removed,
         "is_compacted": is_compacted,
         "is_pending_restatement": is_pending_restatement,
+        "last_altered_ts": last_altered_ts,
     }

sqlmesh/core/state_sync/db/migrator.py CHANGED Viewed

@@ -30,7 +30,6 @@ from sqlmesh.core.state_sync.base import (
     MIN_SCHEMA_VERSION,
     MIN_SQLMESH_VERSION,
 )
-from sqlmesh.core.state_sync.base import StateSync
 from sqlmesh.core.state_sync.db.environment import EnvironmentState
 from sqlmesh.core.state_sync.db.interval import IntervalState
 from sqlmesh.core.state_sync.db.snapshot import SnapshotState
@@ -85,7 +84,7 @@ class StateMigrator:
     def migrate(
         self,
-        state_sync: StateSync,
+        schema: t.Optional[str],
         skip_backup: bool = False,
         promoted_snapshots_only: bool = True,
     ) -> None:
@@ -94,7 +93,7 @@ class StateMigrator:
         migration_start_ts = time.perf_counter()
         try:
-            migrate_rows = self._apply_migrations(state_sync, skip_backup)
+            migrate_rows = self._apply_migrations(schema, skip_backup)
             if not migrate_rows and major_minor(SQLMESH_VERSION) == versions.minor_sqlmesh_version:
                 return
@@ -153,7 +152,7 @@ class StateMigrator:
     def _apply_migrations(
         self,
-        state_sync: StateSync,
+        schema: t.Optional[str],
         skip_backup: bool,
     ) -> bool:
         versions = self.version_state.get_versions()
@@ -184,10 +183,10 @@ class StateMigrator:
         for migration in migrations:
             logger.info(f"Applying migration {migration}")
-            migration.migrate_schemas(state_sync)
+            migration.migrate_schemas(engine_adapter=self.engine_adapter, schema=schema)
             if state_table_exist:
                 # No need to run DML for the initial migration since all tables are empty
-                migration.migrate_rows(state_sync)
+                migration.migrate_rows(engine_adapter=self.engine_adapter, schema=schema)
         snapshot_count_after = self.snapshot_state.count()
@@ -229,6 +228,7 @@ class StateMigrator:
                 "updated_ts": updated_ts,
                 "unpaused_ts": unpaused_ts,
                 "unrestorable": unrestorable,
+                "forward_only": forward_only,
             }
             for where in (
                 snapshot_id_filter(
@@ -237,10 +237,16 @@ class StateMigrator:
                 if snapshots is not None
                 else [None]
             )
-            for name, identifier, raw_snapshot, updated_ts, unpaused_ts, unrestorable in fetchall(
+            for name, identifier, raw_snapshot, updated_ts, unpaused_ts, unrestorable, forward_only in fetchall(
                 self.engine_adapter,
                 exp.select(
-                    "name", "identifier", "snapshot", "updated_ts", "unpaused_ts", "unrestorable"
+                    "name",
+                    "identifier",
+                    "snapshot",
+                    "updated_ts",
+                    "unpaused_ts",
+                    "unrestorable",
+                    "forward_only",
                 )
                 .from_(self.snapshot_state.snapshots_table)
                 .where(where)

sqlmesh/core/state_sync/db/snapshot.py CHANGED Viewed

@@ -14,7 +14,6 @@ from sqlmesh.core.state_sync.db.utils import (
     snapshot_id_filter,
     fetchone,
     fetchall,
-    create_batches,
 )
 from sqlmesh.core.environment import Environment
 from sqlmesh.core.model import SeedModel, ModelKindName
@@ -30,6 +29,12 @@ from sqlmesh.core.snapshot import (
     SnapshotId,
     SnapshotFingerprint,
 )
+from sqlmesh.core.state_sync.common import (
+    RowBoundary,
+    ExpiredSnapshotBatch,
+    ExpiredBatchRange,
+    LimitBoundary,
+)
 from sqlmesh.utils.migration import index_text_type, blob_text_type
 from sqlmesh.utils.date import now_timestamp, TimeLike, to_timestamp
 from sqlmesh.utils import unique
@@ -43,9 +48,6 @@ logger = logging.getLogger(__name__)
 class SnapshotState:
     SNAPSHOT_BATCH_SIZE = 1000
-    # Use a smaller batch size for expired snapshots to account for fetching
-    # of all snapshots that share the same version.
-    EXPIRED_SNAPSHOT_BATCH_SIZE = 200
     def __init__(
         self,
@@ -166,53 +168,62 @@ class SnapshotState:
         self,
         environments: t.Iterable[Environment],
         current_ts: int,
-        ignore_ttl: bool = False,
-    ) -> t.List[SnapshotTableCleanupTask]:
-        """Aggregates the id's of the expired snapshots and creates a list of table cleanup tasks.
-        Expired snapshots are snapshots that have exceeded their time-to-live
-        and are no longer in use within an environment.
-        Returns:
-            The set of expired snapshot ids.
-            The list of table cleanup tasks.
-        """
-        all_cleanup_targets = []
-        for _, cleanup_targets in self._get_expired_snapshots(
-            environments=environments,
-            current_ts=current_ts,
-            ignore_ttl=ignore_ttl,
-        ):
-            all_cleanup_targets.extend(cleanup_targets)
-        return all_cleanup_targets
-    def _get_expired_snapshots(
-        self,
-        environments: t.Iterable[Environment],
-        current_ts: int,
-        ignore_ttl: bool = False,
-    ) -> t.Iterator[t.Tuple[t.Set[SnapshotId], t.List[SnapshotTableCleanupTask]]]:
-        expired_query = exp.select("name", "identifier", "version").from_(self.snapshots_table)
+        ignore_ttl: bool,
+        batch_range: ExpiredBatchRange,
+    ) -> t.Optional[ExpiredSnapshotBatch]:
+        expired_query = exp.select("name", "identifier", "version", "updated_ts").from_(
+            self.snapshots_table
+        )
         if not ignore_ttl:
             expired_query = expired_query.where(
                 (exp.column("updated_ts") + exp.column("ttl_ms")) <= current_ts
             )
+        expired_query = expired_query.where(batch_range.where_filter)
+        promoted_snapshot_ids = {
+            snapshot.snapshot_id
+            for environment in environments
+            for snapshot in (
+                environment.snapshots
+                if environment.finalized_ts is not None
+                # If the environment is not finalized, check both the current snapshots and the previous finalized snapshots
+                else [*environment.snapshots, *(environment.previous_finalized_snapshots or [])]
+            )
+        }
+        if promoted_snapshot_ids:
+            not_in_conditions = [
+                exp.not_(condition)
+                for condition in snapshot_id_filter(
+                    self.engine_adapter,
+                    promoted_snapshot_ids,
+                    batch_size=self.SNAPSHOT_BATCH_SIZE,
+                )
+            ]
+            expired_query = expired_query.where(exp.and_(*not_in_conditions))
+        expired_query = expired_query.order_by(
+            exp.column("updated_ts"), exp.column("name"), exp.column("identifier")
+        )
+        if isinstance(batch_range.end, LimitBoundary):
+            expired_query = expired_query.limit(batch_range.end.batch_size)
+        rows = fetchall(self.engine_adapter, expired_query)
+        if not rows:
+            return None
         expired_candidates = {
             SnapshotId(name=name, identifier=identifier): SnapshotNameVersion(
                 name=name, version=version
             )
-            for name, identifier, version in fetchall(self.engine_adapter, expired_query)
+            for name, identifier, version, _ in rows
         }
         if not expired_candidates:
-            return
-        promoted_snapshot_ids = {
-            snapshot.snapshot_id
-            for environment in environments
-            for snapshot in environment.snapshots
-        }
+            return None
         def _is_snapshot_used(snapshot: SnapshotIdAndVersion) -> bool:
             return (
@@ -220,57 +231,73 @@ class SnapshotState:
                 or snapshot.snapshot_id not in expired_candidates
             )
-        unique_expired_versions = unique(expired_candidates.values())
-        version_batches = create_batches(
-            unique_expired_versions, batch_size=self.EXPIRED_SNAPSHOT_BATCH_SIZE
+        # Extract cursor values from last row for pagination
+        last_row = rows[-1]
+        last_row_boundary = RowBoundary(
+            updated_ts=last_row[3],
+            name=last_row[0],
+            identifier=last_row[1],
         )
-        for versions_batch in version_batches:
-            snapshots = self._get_snapshots_with_same_version(versions_batch)
-            snapshots_by_version = defaultdict(set)
-            snapshots_by_dev_version = defaultdict(set)
-            for s in snapshots:
-                snapshots_by_version[(s.name, s.version)].add(s.snapshot_id)
-                snapshots_by_dev_version[(s.name, s.dev_version)].add(s.snapshot_id)
-            expired_snapshots = [s for s in snapshots if not _is_snapshot_used(s)]
-            all_expired_snapshot_ids = {s.snapshot_id for s in expired_snapshots}
-            cleanup_targets: t.List[t.Tuple[SnapshotId, bool]] = []
-            for snapshot in expired_snapshots:
-                shared_version_snapshots = snapshots_by_version[(snapshot.name, snapshot.version)]
-                shared_version_snapshots.discard(snapshot.snapshot_id)
-                shared_dev_version_snapshots = snapshots_by_dev_version[
-                    (snapshot.name, snapshot.dev_version)
-                ]
-                shared_dev_version_snapshots.discard(snapshot.snapshot_id)
-                if not shared_dev_version_snapshots:
-                    dev_table_only = bool(shared_version_snapshots)
-                    cleanup_targets.append((snapshot.snapshot_id, dev_table_only))
-            snapshot_ids_to_cleanup = [snapshot_id for snapshot_id, _ in cleanup_targets]
-            for snapshot_id_batch in create_batches(
-                snapshot_ids_to_cleanup, batch_size=self.SNAPSHOT_BATCH_SIZE
-            ):
-                snapshot_id_batch_set = set(snapshot_id_batch)
-                full_snapshots = self._get_snapshots(snapshot_id_batch_set)
-                cleanup_tasks = [
+        # The returned batch_range represents the actual range of rows in this batch
+        result_batch_range = ExpiredBatchRange(
+            start=batch_range.start,
+            end=last_row_boundary,
+        )
+        unique_expired_versions = unique(expired_candidates.values())
+        expired_snapshot_ids: t.Set[SnapshotId] = set()
+        cleanup_tasks: t.List[SnapshotTableCleanupTask] = []
+        snapshots = self._get_snapshots_with_same_version(unique_expired_versions)
+        snapshots_by_version = defaultdict(set)
+        snapshots_by_dev_version = defaultdict(set)
+        for s in snapshots:
+            snapshots_by_version[(s.name, s.version)].add(s.snapshot_id)
+            snapshots_by_dev_version[(s.name, s.dev_version)].add(s.snapshot_id)
+        expired_snapshots = [s for s in snapshots if not _is_snapshot_used(s)]
+        all_expired_snapshot_ids = {s.snapshot_id for s in expired_snapshots}
+        cleanup_targets: t.List[t.Tuple[SnapshotId, bool]] = []
+        for snapshot in expired_snapshots:
+            shared_version_snapshots = snapshots_by_version[(snapshot.name, snapshot.version)]
+            shared_version_snapshots.discard(snapshot.snapshot_id)
+            shared_dev_version_snapshots = snapshots_by_dev_version[
+                (snapshot.name, snapshot.dev_version)
+            ]
+            shared_dev_version_snapshots.discard(snapshot.snapshot_id)
+            if not shared_dev_version_snapshots:
+                dev_table_only = bool(shared_version_snapshots)
+                cleanup_targets.append((snapshot.snapshot_id, dev_table_only))
+        snapshot_ids_to_cleanup = [snapshot_id for snapshot_id, _ in cleanup_targets]
+        full_snapshots = self._get_snapshots(snapshot_ids_to_cleanup)
+        for snapshot_id, dev_table_only in cleanup_targets:
+            if snapshot_id in full_snapshots:
+                cleanup_tasks.append(
                     SnapshotTableCleanupTask(
                         snapshot=full_snapshots[snapshot_id].table_info,
                         dev_table_only=dev_table_only,
                     )
-                    for snapshot_id, dev_table_only in cleanup_targets
-                    if snapshot_id in full_snapshots
-                ]
-                all_expired_snapshot_ids -= snapshot_id_batch_set
-                yield snapshot_id_batch_set, cleanup_tasks
+                )
+                expired_snapshot_ids.add(snapshot_id)
+                all_expired_snapshot_ids.discard(snapshot_id)
+        # Add any remaining expired snapshots that don't require cleanup
+        if all_expired_snapshot_ids:
+            expired_snapshot_ids.update(all_expired_snapshot_ids)
+        if expired_snapshot_ids or cleanup_tasks:
+            return ExpiredSnapshotBatch(
+                expired_snapshot_ids=expired_snapshot_ids,
+                cleanup_tasks=cleanup_tasks,
+                batch_range=result_batch_range,
+            )
-            if all_expired_snapshot_ids:
-                # Remaining expired snapshots for which there are no tables
-                # to cleanup
-                yield all_expired_snapshot_ids, []
+        return None
     def delete_snapshots(self, snapshot_ids: t.Iterable[SnapshotIdLike]) -> None:
         """Deletes snapshots.
@@ -337,6 +364,7 @@ class SnapshotState:
                 name=name,
                 identifier=identifier,
                 version=version,
+                kind_name=kind_name or None,
                 dev_version=dev_version,
                 fingerprint=fingerprint,
             )
@@ -344,9 +372,11 @@ class SnapshotState:
                 snapshot_names=snapshot_names,
                 batch_size=self.SNAPSHOT_BATCH_SIZE,
             )
-            for name, identifier, version, dev_version, fingerprint in fetchall(
+            for name, identifier, version, kind_name, dev_version, fingerprint in fetchall(
                 self.engine_adapter,
-                exp.select("name", "identifier", "version", "dev_version", "fingerprint")
+                exp.select(
+                    "name", "identifier", "version", "kind_name", "dev_version", "fingerprint"
+                )
                 .from_(self.snapshots_table)
                 .where(where)
                 .and_(unexpired_expr),
@@ -661,6 +691,7 @@ class SnapshotState:
                     "name",
                     "identifier",
                     "version",
+                    "kind_name",
                     "dev_version",
                     "fingerprint",
                 )
@@ -677,10 +708,11 @@ class SnapshotState:
                 name=name,
                 identifier=identifier,
                 version=version,
+                kind_name=kind_name or None,
                 dev_version=dev_version,
                 fingerprint=SnapshotFingerprint.parse_raw(fingerprint),
             )
-            for name, identifier, version, dev_version, fingerprint in snapshot_rows
+            for name, identifier, version, kind_name, dev_version, fingerprint in snapshot_rows
         ]

sqlmesh/core/table_diff.py CHANGED Viewed

@@ -367,8 +367,8 @@ class TableDiff:
                 column_type = matched_columns[name]
                 qualified_column = exp.column(name, table)
-                if column_type.is_type(*exp.DataType.FLOAT_TYPES):
-                    return exp.func("ROUND", qualified_column, exp.Literal.number(self.decimals))
+                if column_type.is_type(*exp.DataType.REAL_TYPES):
+                    return self.adapter._normalize_decimal_value(qualified_column, self.decimals)
                 if column_type.is_type(*exp.DataType.NESTED_TYPES):
                     return self.adapter._normalize_nested_value(qualified_column)

sqlmesh/core/test/definition.py CHANGED Viewed

@@ -100,8 +100,11 @@ class ModelTest(unittest.TestCase):
         self._validate_and_normalize_test()
         if self.engine_adapter.default_catalog:
-            self._fixture_catalog: t.Optional[exp.Identifier] = exp.parse_identifier(
-                self.engine_adapter.default_catalog, dialect=self._test_adapter_dialect
+            self._fixture_catalog: t.Optional[exp.Identifier] = normalize_identifiers(
+                exp.parse_identifier(
+                    self.engine_adapter.default_catalog, dialect=self._test_adapter_dialect
+                ),
+                dialect=self._test_adapter_dialect,
             )
         else:
             self._fixture_catalog = None
@@ -451,6 +454,9 @@ class ModelTest(unittest.TestCase):
         query = outputs.get("query")
         partial = outputs.pop("partial", None)
+        if ctes is None and query is None:
+            _raise_error("Incomplete test, outputs must contain 'query' or 'ctes'", self.path)
         def _normalize_rows(
             values: t.List[Row] | t.Dict,
             name: str,
@@ -641,16 +647,16 @@ class ModelTest(unittest.TestCase):
             return self._execute(query)
         rows = values["rows"]
+        columns_str: t.Optional[t.List[str]] = None
         if columns:
+            columns_str = [str(c) for c in columns]
             referenced_columns = list(dict.fromkeys(col for row in rows for col in row))
             _raise_if_unexpected_columns(columns, referenced_columns)
             if partial:
-                columns = referenced_columns
+                columns_str = [c for c in columns_str if c in referenced_columns]
-        return pd.DataFrame.from_records(
-            rows, columns=[str(c) for c in columns] if columns else None
-        )
+        return pd.DataFrame.from_records(rows, columns=columns_str)
     def _add_missing_columns(
         self, query: exp.Query, all_columns: t.Optional[t.Collection[str]] = None
@@ -801,7 +807,7 @@ class PythonModelTest(ModelTest):
             actual_df.reset_index(drop=True, inplace=True)
             expected = self._create_df(values, columns=self.model.columns_to_types, partial=partial)
-            self.assert_equal(expected, actual_df, sort=False, partial=partial)
+            self.assert_equal(expected, actual_df, sort=True, partial=partial)
     def _execute_model(self) -> pd.DataFrame:
         """Executes the python model and returns a DataFrame."""
@@ -919,8 +925,7 @@ def generate_test(
                 cte_output = test._execute(cte_query)
                 ctes[cte.alias] = (
                     pandas_timestamp_to_pydatetime(
-                        cte_output.apply(lambda col: col.map(_normalize_df_value)),
-                        cte_query.named_selects,
+                        df=cte_output.apply(lambda col: col.map(_normalize_df_value)),
                     )
                     .replace({np.nan: None})
                     .to_dict(orient="records")

sqlmesh/core/test/discovery.py CHANGED Viewed

@@ -20,6 +20,10 @@ class ModelTestMetadata(PydanticModel):
     def fully_qualified_test_name(self) -> str:
         return f"{self.path}::{self.test_name}"
+    @property
+    def model_name(self) -> str:
+        return self.body.get("model", "")
     def __hash__(self) -> int:
         return self.fully_qualified_test_name.__hash__()

sqlmesh/dbt/adapter.py CHANGED Viewed

@@ -115,30 +115,39 @@ class BaseAdapter(abc.ABC):
         """Returns the value quoted according to the quote policy."""
         return self.quote(value) if getattr(self.quote_policy, component_type, False) else value
-    def dispatch(self, name: str, package: t.Optional[str] = None) -> t.Callable:
+    def dispatch(
+        self,
+        macro_name: str,
+        macro_namespace: t.Optional[str] = None,
+    ) -> t.Callable:
         """Returns a dialect-specific version of a macro with the given name."""
         target_type = self.jinja_globals["target"]["type"]
-        macro_suffix = f"__{name}"
+        macro_suffix = f"__{macro_name}"
         def _relevance(package_name_pair: t.Tuple[t.Optional[str], str]) -> t.Tuple[int, int]:
             """Lower scores more relevant."""
-            macro_package, macro_name = package_name_pair
+            macro_package, name = package_name_pair
-            package_score = 0 if macro_package == package else 1
+            package_score = 0 if macro_package == macro_namespace else 1
             name_score = 1
-            if macro_name.startswith("default"):
+            if name.startswith("default"):
                 name_score = 2
-            elif macro_name.startswith(target_type):
+            elif name.startswith(target_type):
                 name_score = 0
             return name_score, package_score
         jinja_env = self.jinja_macros.build_environment(**self.jinja_globals).globals
-        packages_to_check: t.List[t.Optional[str]] = [
-            package,
-            *(k for k in jinja_env if k.startswith("dbt")),
-        ]
+        packages_to_check: t.List[t.Optional[str]] = [None]
+        if macro_namespace is not None:
+            if macro_namespace in jinja_env:
+                packages_to_check = [self.jinja_macros.root_package_name, macro_namespace]
+        # Add dbt packages as fallback
+        packages_to_check.extend(k for k in jinja_env if k.startswith("dbt"))
         candidates = {}
         for macro_package in packages_to_check:
             macros = jinja_env.get(macro_package, {}) if macro_package else jinja_env
@@ -156,7 +165,7 @@ class BaseAdapter(abc.ABC):
             sorted_candidates = sorted(candidates, key=_relevance)
             return candidates[sorted_candidates[0]]
-        raise ConfigError(f"Macro '{name}', package '{package}' was not found.")
+        raise ConfigError(f"Macro '{macro_name}', package '{macro_namespace}' was not found.")
     def type(self) -> str:
         return self.project_dialect or ""

sqlmesh 0.217.1.dev1__py3-none-any.whl → 0.227.2.dev20__py3-none-any.whl

sqlmesh 0.217.1.dev1py3-none-any.whl → 0.227.2.dev20py3-none-any.whl