PyPI - dvt-core - Versions diffs - 1.11.0b4__py3-none-any.whl - Mend

dvt-core 1.11.0b4__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of dvt-core might be problematic. Click here for more details.

Files changed (261) hide show

dvt/__init__.py +7 -0
dvt/_pydantic_shim.py +26 -0
dvt/adapters/__init__.py +16 -0
dvt/adapters/multi_adapter_manager.py +268 -0
dvt/artifacts/__init__.py +0 -0
dvt/artifacts/exceptions/__init__.py +1 -0
dvt/artifacts/exceptions/schemas.py +31 -0
dvt/artifacts/resources/__init__.py +116 -0
dvt/artifacts/resources/base.py +68 -0
dvt/artifacts/resources/types.py +93 -0
dvt/artifacts/resources/v1/analysis.py +10 -0
dvt/artifacts/resources/v1/catalog.py +23 -0
dvt/artifacts/resources/v1/components.py +275 -0
dvt/artifacts/resources/v1/config.py +282 -0
dvt/artifacts/resources/v1/documentation.py +11 -0
dvt/artifacts/resources/v1/exposure.py +52 -0
dvt/artifacts/resources/v1/function.py +53 -0
dvt/artifacts/resources/v1/generic_test.py +32 -0
dvt/artifacts/resources/v1/group.py +22 -0
dvt/artifacts/resources/v1/hook.py +11 -0
dvt/artifacts/resources/v1/macro.py +30 -0
dvt/artifacts/resources/v1/metric.py +173 -0
dvt/artifacts/resources/v1/model.py +146 -0
dvt/artifacts/resources/v1/owner.py +10 -0
dvt/artifacts/resources/v1/saved_query.py +112 -0
dvt/artifacts/resources/v1/seed.py +42 -0
dvt/artifacts/resources/v1/semantic_layer_components.py +72 -0
dvt/artifacts/resources/v1/semantic_model.py +315 -0
dvt/artifacts/resources/v1/singular_test.py +14 -0
dvt/artifacts/resources/v1/snapshot.py +92 -0
dvt/artifacts/resources/v1/source_definition.py +85 -0
dvt/artifacts/resources/v1/sql_operation.py +10 -0
dvt/artifacts/resources/v1/unit_test_definition.py +78 -0
dvt/artifacts/schemas/__init__.py +0 -0
dvt/artifacts/schemas/base.py +191 -0
dvt/artifacts/schemas/batch_results.py +24 -0
dvt/artifacts/schemas/catalog/__init__.py +12 -0
dvt/artifacts/schemas/catalog/v1/__init__.py +0 -0
dvt/artifacts/schemas/catalog/v1/catalog.py +60 -0
dvt/artifacts/schemas/freshness/__init__.py +1 -0
dvt/artifacts/schemas/freshness/v3/__init__.py +0 -0
dvt/artifacts/schemas/freshness/v3/freshness.py +159 -0
dvt/artifacts/schemas/manifest/__init__.py +2 -0
dvt/artifacts/schemas/manifest/v12/__init__.py +0 -0
dvt/artifacts/schemas/manifest/v12/manifest.py +212 -0
dvt/artifacts/schemas/results.py +148 -0
dvt/artifacts/schemas/run/__init__.py +2 -0
dvt/artifacts/schemas/run/v5/__init__.py +0 -0
dvt/artifacts/schemas/run/v5/run.py +184 -0
dvt/artifacts/schemas/upgrades/__init__.py +4 -0
dvt/artifacts/schemas/upgrades/upgrade_manifest.py +174 -0
dvt/artifacts/schemas/upgrades/upgrade_manifest_dbt_version.py +2 -0
dvt/artifacts/utils/validation.py +153 -0
dvt/cli/__init__.py +1 -0
dvt/cli/context.py +16 -0
dvt/cli/exceptions.py +56 -0
dvt/cli/flags.py +558 -0
dvt/cli/main.py +971 -0
dvt/cli/option_types.py +121 -0
dvt/cli/options.py +79 -0
dvt/cli/params.py +803 -0
dvt/cli/requires.py +478 -0
dvt/cli/resolvers.py +32 -0
dvt/cli/types.py +40 -0
dvt/clients/__init__.py +0 -0
dvt/clients/checked_load.py +82 -0
dvt/clients/git.py +164 -0
dvt/clients/jinja.py +206 -0
dvt/clients/jinja_static.py +245 -0
dvt/clients/registry.py +192 -0
dvt/clients/yaml_helper.py +68 -0
dvt/compilation.py +833 -0
dvt/compute/__init__.py +26 -0
dvt/compute/base.py +288 -0
dvt/compute/engines/__init__.py +13 -0
dvt/compute/engines/duckdb_engine.py +368 -0
dvt/compute/engines/spark_engine.py +273 -0
dvt/compute/query_analyzer.py +212 -0
dvt/compute/router.py +483 -0
dvt/config/__init__.py +4 -0
dvt/config/catalogs.py +95 -0
dvt/config/compute_config.py +406 -0
dvt/config/profile.py +411 -0
dvt/config/profiles_v2.py +464 -0
dvt/config/project.py +893 -0
dvt/config/renderer.py +232 -0
dvt/config/runtime.py +491 -0
dvt/config/selectors.py +209 -0
dvt/config/utils.py +78 -0
dvt/connectors/.gitignore +6 -0
dvt/connectors/README.md +306 -0
dvt/connectors/catalog.yml +217 -0
dvt/connectors/download_connectors.py +300 -0
dvt/constants.py +29 -0
dvt/context/__init__.py +0 -0
dvt/context/base.py +746 -0
dvt/context/configured.py +136 -0
dvt/context/context_config.py +350 -0
dvt/context/docs.py +82 -0
dvt/context/exceptions_jinja.py +179 -0
dvt/context/macro_resolver.py +195 -0
dvt/context/macros.py +171 -0
dvt/context/manifest.py +73 -0
dvt/context/providers.py +2198 -0
dvt/context/query_header.py +14 -0
dvt/context/secret.py +59 -0
dvt/context/target.py +74 -0
dvt/contracts/__init__.py +0 -0
dvt/contracts/files.py +413 -0
dvt/contracts/graph/__init__.py +0 -0
dvt/contracts/graph/manifest.py +1904 -0
dvt/contracts/graph/metrics.py +98 -0
dvt/contracts/graph/model_config.py +71 -0
dvt/contracts/graph/node_args.py +42 -0
dvt/contracts/graph/nodes.py +1806 -0
dvt/contracts/graph/semantic_manifest.py +233 -0
dvt/contracts/graph/unparsed.py +812 -0
dvt/contracts/project.py +417 -0
dvt/contracts/results.py +53 -0
dvt/contracts/selection.py +23 -0
dvt/contracts/sql.py +86 -0
dvt/contracts/state.py +69 -0
dvt/contracts/util.py +46 -0
dvt/deprecations.py +347 -0
dvt/deps/__init__.py +0 -0
dvt/deps/base.py +153 -0
dvt/deps/git.py +196 -0
dvt/deps/local.py +80 -0
dvt/deps/registry.py +131 -0
dvt/deps/resolver.py +149 -0
dvt/deps/tarball.py +121 -0
dvt/docs/source/_ext/dbt_click.py +118 -0
dvt/docs/source/conf.py +32 -0
dvt/env_vars.py +64 -0
dvt/event_time/event_time.py +40 -0
dvt/event_time/sample_window.py +60 -0
dvt/events/__init__.py +16 -0
dvt/events/base_types.py +37 -0
dvt/events/core_types_pb2.py +2 -0
dvt/events/logging.py +109 -0
dvt/events/types.py +2534 -0
dvt/exceptions.py +1487 -0
dvt/flags.py +89 -0
dvt/graph/__init__.py +11 -0
dvt/graph/cli.py +248 -0
dvt/graph/graph.py +172 -0
dvt/graph/queue.py +213 -0
dvt/graph/selector.py +375 -0
dvt/graph/selector_methods.py +976 -0
dvt/graph/selector_spec.py +223 -0
dvt/graph/thread_pool.py +18 -0
dvt/hooks.py +21 -0
dvt/include/README.md +49 -0
dvt/include/__init__.py +3 -0
dvt/include/global_project.py +4 -0
dvt/include/starter_project/.gitignore +4 -0
dvt/include/starter_project/README.md +15 -0
dvt/include/starter_project/__init__.py +3 -0
dvt/include/starter_project/analyses/.gitkeep +0 -0
dvt/include/starter_project/dvt_project.yml +36 -0
dvt/include/starter_project/macros/.gitkeep +0 -0
dvt/include/starter_project/models/example/my_first_dbt_model.sql +27 -0
dvt/include/starter_project/models/example/my_second_dbt_model.sql +6 -0
dvt/include/starter_project/models/example/schema.yml +21 -0
dvt/include/starter_project/seeds/.gitkeep +0 -0
dvt/include/starter_project/snapshots/.gitkeep +0 -0
dvt/include/starter_project/tests/.gitkeep +0 -0
dvt/internal_deprecations.py +27 -0
dvt/jsonschemas/__init__.py +3 -0
dvt/jsonschemas/jsonschemas.py +309 -0
dvt/jsonschemas/project/0.0.110.json +4717 -0
dvt/jsonschemas/project/0.0.85.json +2015 -0
dvt/jsonschemas/resources/0.0.110.json +2636 -0
dvt/jsonschemas/resources/0.0.85.json +2536 -0
dvt/jsonschemas/resources/latest.json +6773 -0
dvt/links.py +4 -0
dvt/materializations/__init__.py +0 -0
dvt/materializations/incremental/__init__.py +0 -0
dvt/materializations/incremental/microbatch.py +235 -0
dvt/mp_context.py +8 -0
dvt/node_types.py +37 -0
dvt/parser/__init__.py +23 -0
dvt/parser/analysis.py +21 -0
dvt/parser/base.py +549 -0
dvt/parser/common.py +267 -0
dvt/parser/docs.py +52 -0
dvt/parser/fixtures.py +51 -0
dvt/parser/functions.py +30 -0
dvt/parser/generic_test.py +100 -0
dvt/parser/generic_test_builders.py +334 -0
dvt/parser/hooks.py +119 -0
dvt/parser/macros.py +137 -0
dvt/parser/manifest.py +2204 -0
dvt/parser/models.py +574 -0
dvt/parser/partial.py +1179 -0
dvt/parser/read_files.py +445 -0
dvt/parser/schema_generic_tests.py +423 -0
dvt/parser/schema_renderer.py +111 -0
dvt/parser/schema_yaml_readers.py +936 -0
dvt/parser/schemas.py +1467 -0
dvt/parser/search.py +149 -0
dvt/parser/seeds.py +28 -0
dvt/parser/singular_test.py +20 -0
dvt/parser/snapshots.py +44 -0
dvt/parser/sources.py +557 -0
dvt/parser/sql.py +63 -0
dvt/parser/unit_tests.py +622 -0
dvt/plugins/__init__.py +20 -0
dvt/plugins/contracts.py +10 -0
dvt/plugins/exceptions.py +2 -0
dvt/plugins/manager.py +164 -0
dvt/plugins/manifest.py +21 -0
dvt/profiler.py +20 -0
dvt/py.typed +1 -0
dvt/runners/__init__.py +2 -0
dvt/runners/exposure_runner.py +7 -0
dvt/runners/no_op_runner.py +46 -0
dvt/runners/saved_query_runner.py +7 -0
dvt/selected_resources.py +8 -0
dvt/task/__init__.py +0 -0
dvt/task/base.py +504 -0
dvt/task/build.py +197 -0
dvt/task/clean.py +57 -0
dvt/task/clone.py +162 -0
dvt/task/compile.py +151 -0
dvt/task/compute.py +366 -0
dvt/task/debug.py +650 -0
dvt/task/deps.py +280 -0
dvt/task/docs/__init__.py +3 -0
dvt/task/docs/generate.py +408 -0
dvt/task/docs/index.html +250 -0
dvt/task/docs/serve.py +28 -0
dvt/task/freshness.py +323 -0
dvt/task/function.py +122 -0
dvt/task/group_lookup.py +46 -0
dvt/task/init.py +374 -0
dvt/task/list.py +237 -0
dvt/task/printer.py +176 -0
dvt/task/profiles.py +256 -0
dvt/task/retry.py +175 -0
dvt/task/run.py +1146 -0
dvt/task/run_operation.py +142 -0
dvt/task/runnable.py +802 -0
dvt/task/seed.py +104 -0
dvt/task/show.py +150 -0
dvt/task/snapshot.py +57 -0
dvt/task/sql.py +111 -0
dvt/task/test.py +464 -0
dvt/tests/fixtures/__init__.py +1 -0
dvt/tests/fixtures/project.py +620 -0
dvt/tests/util.py +651 -0
dvt/tracking.py +529 -0
dvt/utils/__init__.py +3 -0
dvt/utils/artifact_upload.py +151 -0
dvt/utils/utils.py +408 -0
dvt/version.py +249 -0
dvt_core-1.11.0b4.dist-info/METADATA +252 -0
dvt_core-1.11.0b4.dist-info/RECORD +261 -0
dvt_core-1.11.0b4.dist-info/WHEEL +5 -0
dvt_core-1.11.0b4.dist-info/entry_points.txt +2 -0
dvt_core-1.11.0b4.dist-info/top_level.txt +1 -0

dvt/task/base.py ADDED Viewed

@@ -0,0 +1,504 @@
+import os
+import threading
+import time
+import traceback
+from abc import ABCMeta, abstractmethod
+from contextlib import nullcontext
+from datetime import datetime, timezone
+from pathlib import Path
+from typing import Any, Dict, List, Optional, Set
+import dvt.exceptions
+from dvt import tracking
+from dvt.artifacts.resources.types import NodeType
+from dvt.artifacts.schemas.results import (
+    NodeStatus,
+    RunningStatus,
+    RunStatus,
+    TimingInfo,
+    collect_timing_info,
+)
+from dvt.artifacts.schemas.run import RunResult
+from dvt.cli.flags import Flags
+from dvt.compilation import Compiler
+from dvt.config import RuntimeConfig
+from dvt.config.profile import read_profile
+from dvt.constants import DBT_PROJECT_FILE_NAME
+from dvt.contracts.graph.manifest import Manifest
+from dvt.events.types import (
+    CatchableExceptionOnRun,
+    GenericExceptionOnRun,
+    InternalErrorOnRun,
+    LogDbtProfileError,
+    LogDbtProjectError,
+    LogDebugStackTrace,
+    LogSkipBecauseError,
+    NodeCompiling,
+    NodeConnectionReleaseError,
+    NodeExecuting,
+    SkippingDetails,
+)
+from dvt.flags import get_flags
+from dvt.graph import Graph
+from dvt.task import group_lookup
+from dvt.task.printer import print_run_result_error
+import dbt_common.exceptions.base
+from dbt_common.events.contextvars import get_node_info
+from dbt_common.events.functions import fire_event
+from dbt_common.exceptions import DbtInternalError, DbtRuntimeError, NotImplementedError
+def read_profiles(profiles_dir: Optional[str] = None) -> Dict[str, Any]:
+    """This is only used for some error handling"""
+    if profiles_dir is None:
+        profiles_dir = get_flags().PROFILES_DIR
+    raw_profiles = read_profile(profiles_dir)
+    if raw_profiles is None:
+        profiles = {}
+    else:
+        profiles = {k: v for (k, v) in raw_profiles.items() if k != "config"}
+    return profiles
+class BaseTask(metaclass=ABCMeta):
+    def __init__(self, args: Flags) -> None:
+        self.args = args
+    def __enter__(self):
+        self.orig_dir = os.getcwd()
+        return self
+    def __exit__(self, exc_type, exc_value, traceback):
+        os.chdir(self.orig_dir)
+    @abstractmethod
+    def run(self):
+        raise dbt_common.exceptions.base.NotImplementedError("Not Implemented")
+    def interpret_results(self, results):
+        return True
+def get_nearest_project_dir(project_dir: Optional[str]) -> Path:
+    # If the user provides an explicit project directory, use that
+    # but don't look at parent directories.
+    if project_dir:
+        cur_dir = Path(project_dir)
+        project_file = Path(project_dir) / DBT_PROJECT_FILE_NAME
+        if project_file.is_file():
+            return cur_dir
+        else:
+            raise dbt_common.exceptions.DbtRuntimeError(
+                "fatal: Invalid --project-dir flag. Not a dbt project. "
+                "Missing dbt_project.yml file"
+            )
+    cur_dir = Path.cwd()
+    project_file = cur_dir / DBT_PROJECT_FILE_NAME
+    if project_file.is_file():
+        return cur_dir
+    else:
+        raise dbt_common.exceptions.DbtRuntimeError(
+            "fatal: Not a dbt project (or any of the parent directories). "
+            "Missing dbt_project.yml file"
+        )
+def move_to_nearest_project_dir(project_dir: Optional[str]) -> Path:
+    nearest_project_dir = get_nearest_project_dir(project_dir)
+    os.chdir(nearest_project_dir)
+    return nearest_project_dir
+# TODO: look into deprecating this class in favor of several small functions that
+# produce the same behavior. currently this class only contains manifest compilation,
+# holding a manifest, and moving direcories.
+class ConfiguredTask(BaseTask):
+    def __init__(
+        self, args: Flags, config: RuntimeConfig, manifest: Optional[Manifest] = None
+    ) -> None:
+        super().__init__(args)
+        self.config = config
+        self.graph: Optional[Graph] = None
+        self.manifest = manifest
+        self.compiler = Compiler(self.config)
+    def compile_manifest(self) -> None:
+        if self.manifest is None:
+            raise DbtInternalError("compile_manifest called before manifest was loaded")
+        start_compile_manifest = time.perf_counter()
+        self.graph = self.compiler.compile(self.manifest)
+        compile_time = time.perf_counter() - start_compile_manifest
+        if dbt.tracking.active_user is not None:
+            dbt.tracking.track_runnable_timing({"graph_compilation_elapsed": compile_time})
+    @classmethod
+    def from_args(cls, args: Flags, *pargs, **kwargs):
+        move_to_nearest_project_dir(args.project_dir)
+        try:
+            # This is usually RuntimeConfig
+            config = RuntimeConfig.from_args(args)
+        except dbt.exceptions.DbtProjectError as exc:
+            fire_event(LogDbtProjectError(exc=str(exc)))
+            tracking.track_invalid_invocation(args=args, result_type=exc.result_type)
+            raise dbt_common.exceptions.DbtRuntimeError("Could not run dbt") from exc
+        except dbt.exceptions.DbtProfileError as exc:
+            all_profile_names = list(read_profiles(get_flags().PROFILES_DIR).keys())
+            fire_event(LogDbtProfileError(exc=str(exc), profiles=all_profile_names))
+            tracking.track_invalid_invocation(args=args, result_type=exc.result_type)
+            raise dbt_common.exceptions.DbtRuntimeError("Could not run dbt") from exc
+        return cls(args, config, *pargs, **kwargs)
+class ExecutionContext:
+    """During execution and error handling, dbt makes use of mutable state:
+    timing information and the newest (compiled vs executed) form of the node.
+    """
+    def __init__(self, node) -> None:
+        self.timing: List[TimingInfo] = []
+        self.node = node
+class BaseRunner(metaclass=ABCMeta):
+    def __init__(self, config, adapter, node, node_index: int, num_nodes: int) -> None:
+        self.config = config
+        self.compiler = Compiler(config)
+        self.adapter = adapter
+        self.node = node
+        self.node_index = node_index
+        self.num_nodes = num_nodes
+        self.skip = False
+        self.skip_cause: Optional[RunResult] = None
+        self.run_ephemeral_models = False
+    @abstractmethod
+    def compile(self, manifest: Manifest) -> Any:
+        pass
+    def _node_build_path(self) -> Optional[str]:
+        return self.node.build_path if hasattr(self.node, "build_path") else None
+    def get_result_status(self, result) -> Dict[str, str]:
+        if result.status == NodeStatus.Error:
+            return {"node_status": "error", "node_error": str(result.message)}
+        elif result.status == NodeStatus.Skipped:
+            return {"node_status": "skipped"}
+        elif result.status == NodeStatus.Fail:
+            return {"node_status": "failed"}
+        elif result.status == NodeStatus.Warn:
+            return {"node_status": "warn"}
+        else:
+            return {"node_status": "passed"}
+    def run_with_hooks(self, manifest):
+        if self.skip:
+            return self.on_skip()
+        # no before/after printing for ephemeral mdoels
+        if not self.node.is_ephemeral_model:
+            self.before_execute()
+        result = self.safe_run(manifest)
+        self.node.update_event_status(
+            node_status=result.status,
+            finished_at=datetime.now(timezone.utc).replace(tzinfo=None).isoformat(),
+        )
+        if not self.node.is_ephemeral_model:
+            self.after_execute(result)
+        return result
+    def _build_run_result(
+        self,
+        node,
+        start_time,
+        status,
+        timing_info,
+        message,
+        agate_table=None,
+        adapter_response=None,
+        failures=None,
+        batch_results=None,
+    ):
+        execution_time = time.time() - start_time
+        thread_id = threading.current_thread().name
+        if adapter_response is None:
+            adapter_response = {}
+        return RunResult(
+            status=status,
+            thread_id=thread_id,
+            execution_time=execution_time,
+            timing=timing_info,
+            message=message,
+            node=node,
+            agate_table=agate_table,
+            adapter_response=adapter_response,
+            failures=failures,
+            batch_results=batch_results,
+        )
+    def error_result(self, node, message, start_time, timing_info):
+        return self._build_run_result(
+            node=node,
+            start_time=start_time,
+            status=RunStatus.Error,
+            timing_info=timing_info,
+            message=message,
+        )
+    def ephemeral_result(self, node, start_time, timing_info):
+        return self._build_run_result(
+            node=node,
+            start_time=start_time,
+            status=RunStatus.Success,
+            timing_info=timing_info,
+            message=None,
+        )
+    def from_run_result(self, result, start_time, timing_info):
+        return self._build_run_result(
+            node=result.node,
+            start_time=start_time,
+            status=result.status,
+            timing_info=timing_info,
+            message=result.message,
+            agate_table=result.agate_table,
+            adapter_response=result.adapter_response,
+            failures=result.failures,
+            batch_results=result.batch_results,
+        )
+    def compile_and_execute(self, manifest: Manifest, ctx: ExecutionContext):
+        result = None
+        with (
+            self.adapter.connection_named(self.node.unique_id, self.node)
+            if get_flags().INTROSPECT
+            else nullcontext()
+        ):
+            ctx.node.update_event_status(node_status=RunningStatus.Compiling)
+            fire_event(
+                NodeCompiling(
+                    node_info=ctx.node.node_info,
+                )
+            )
+            with collect_timing_info("compile", ctx.timing.append):
+                # if we fail here, we still have a compiled node to return
+                # this has the benefit of showing a build path for the errant
+                # model.  This calls the 'compile' method in CompileTask
+                ctx.node = self.compile(manifest)
+            # for ephemeral nodes, we only want to compile, not run
+            if not ctx.node.is_ephemeral_model or self.run_ephemeral_models:
+                ctx.node.update_event_status(node_status=RunningStatus.Executing)
+                fire_event(
+                    NodeExecuting(
+                        node_info=ctx.node.node_info,
+                    )
+                )
+                with collect_timing_info("execute", ctx.timing.append):
+                    result = self.run(ctx.node, manifest)
+                    ctx.node = result.node
+        return result
+    def _handle_catchable_exception(self, e: DbtRuntimeError, ctx: ExecutionContext) -> str:
+        if e.node is None:
+            e.add_node(ctx.node)
+        fire_event(
+            CatchableExceptionOnRun(
+                exc=str(e), exc_info=traceback.format_exc(), node_info=get_node_info()
+            )
+        )
+        return str(e)
+    def _handle_internal_exception(self, e: DbtInternalError, ctx: ExecutionContext) -> str:
+        fire_event(
+            InternalErrorOnRun(
+                build_path=self._node_build_path(), exc=str(e), node_info=get_node_info()
+            )
+        )
+        return str(e)
+    def _handle_generic_exception(self, e: Exception, ctx: ExecutionContext) -> str:
+        fire_event(
+            GenericExceptionOnRun(
+                build_path=self._node_build_path(),
+                unique_id=self.node.unique_id,
+                exc=str(e),
+                node_info=get_node_info(),
+            )
+        )
+        fire_event(LogDebugStackTrace(exc_info=traceback.format_exc()))
+        return str(e)
+    def handle_exception(self, e: Exception, ctx: ExecutionContext) -> str:
+        if isinstance(e, DbtRuntimeError):
+            error = self._handle_catchable_exception(e, ctx)
+        elif isinstance(e, DbtInternalError):
+            error = self._handle_internal_exception(e, ctx)
+        else:
+            error = self._handle_generic_exception(e, ctx)
+        return error
+    def safe_run(self, manifest: Manifest):
+        started = time.time()
+        ctx = ExecutionContext(self.node)
+        error = None
+        result = None
+        try:
+            result = self.compile_and_execute(manifest, ctx)
+        except Exception as e:
+            error = self.handle_exception(e, ctx)
+        finally:
+            exc_str = self._safe_release_connection()
+            # if releasing failed and the result doesn't have an error yet, set
+            # an error
+            if (
+                exc_str is not None
+                and result is not None
+                and result.status != NodeStatus.Error
+                and error is None
+            ):
+                error = exc_str
+        if error is not None:
+            result = self.error_result(ctx.node, error, started, ctx.timing)
+        elif result is not None:
+            result = self.from_run_result(result, started, ctx.timing)
+        else:
+            result = self.ephemeral_result(ctx.node, started, ctx.timing)
+        return result
+    def _safe_release_connection(self):
+        """Try to release a connection. If an exception is hit, log and return
+        the error string.
+        """
+        try:
+            self.adapter.release_connection()
+        except Exception as exc:
+            fire_event(
+                NodeConnectionReleaseError(
+                    node_name=self.node.name, exc=str(exc), exc_info=traceback.format_exc()
+                )
+            )
+            return str(exc)
+        return None
+    def before_execute(self) -> None:
+        raise NotImplementedError("before_execute is not implemented")
+    def execute(self, compiled_node, manifest):
+        raise NotImplementedError("execute is not implemented")
+    def run(self, compiled_node, manifest):
+        return self.execute(compiled_node, manifest)
+    def after_execute(self, result) -> None:
+        raise NotImplementedError("after_execute is not implemented")
+    def _skip_caused_by_ephemeral_failure(self) -> bool:
+        if self.skip_cause is None or self.skip_cause.node is None:
+            return False
+        return self.skip_cause.node.is_ephemeral_model
+    def on_skip(self):
+        schema_name = getattr(self.node, "schema", "")
+        node_name = self.node.name
+        error_message = None
+        if not self.node.is_ephemeral_model:
+            # if this model was skipped due to an upstream ephemeral model
+            # failure, print a special 'error skip' message.
+            # Include skip_cause NodeStatus
+            group = group_lookup.get(self.node.unique_id)
+            if self._skip_caused_by_ephemeral_failure():
+                fire_event(
+                    LogSkipBecauseError(
+                        schema=schema_name,
+                        relation=node_name,
+                        index=self.node_index,
+                        total=self.num_nodes,
+                        status=self.skip_cause.status,
+                        group=group,
+                    )
+                )
+                # skip_cause here should be the run_result from the ephemeral model
+                print_run_result_error(result=self.skip_cause, newline=False)
+                if self.skip_cause is None:  # mypy appeasement
+                    raise DbtInternalError(
+                        "Skip cause not set but skip was somehow caused by an ephemeral failure"
+                    )
+                # set an error so dbt will exit with an error code
+                error_message = (
+                    "Compilation Error in {}, caused by compilation error "
+                    "in referenced ephemeral model {}".format(
+                        self.node.unique_id, self.skip_cause.node.unique_id
+                    )
+                )
+            else:
+                # 'skipped' nodes should not have a value for 'node_finished_at'
+                # they do have 'node_started_at', which is set in GraphRunnableTask.call_runner
+                self.node.update_event_status(node_status=RunStatus.Skipped)
+                fire_event(
+                    SkippingDetails(
+                        resource_type=self.node.resource_type,
+                        schema=schema_name,
+                        node_name=node_name,
+                        index=self.node_index,
+                        total=self.num_nodes,
+                        node_info=self.node.node_info,
+                        group=group,
+                    )
+                )
+        node_result = RunResult.from_node(self.node, RunStatus.Skipped, error_message)
+        return node_result
+    def do_skip(self, cause=None) -> None:
+        self.skip = True
+        self.skip_cause = cause
+def resource_types_from_args(
+    args: Flags, all_resource_values: Set[NodeType], default_resource_values: Set[NodeType]
+) -> Set[NodeType]:
+    if not args.resource_types:
+        resource_types = default_resource_values
+    else:
+        # This is a list of strings, not NodeTypes
+        arg_resource_types = set(args.resource_types)
+        if "all" in arg_resource_types:
+            arg_resource_types.remove("all")
+            arg_resource_types.update(all_resource_values)
+        if "default" in arg_resource_types:
+            arg_resource_types.remove("default")
+            arg_resource_types.update(default_resource_values)
+        # Convert to a set of NodeTypes now that the non-NodeType strings are gone
+        resource_types = set([NodeType(rt) for rt in list(arg_resource_types)])
+    if args.exclude_resource_types:
+        # Convert from a list of strings to a set of NodeTypes
+        exclude_resource_types = set([NodeType(rt) for rt in args.exclude_resource_types])
+        resource_types = resource_types - exclude_resource_types
+    return resource_types

dvt/task/build.py ADDED Viewed

@@ -0,0 +1,197 @@
+from typing import Dict, List, Optional, Set, Type
+from dvt.artifacts.schemas.results import NodeStatus
+from dvt.artifacts.schemas.run import RunResult
+from dvt.cli.flags import Flags
+from dvt.config.runtime import RuntimeConfig
+from dvt.contracts.graph.manifest import Manifest
+from dvt.exceptions import DbtInternalError
+from dvt.graph import Graph, GraphQueue, ResourceTypeSelector
+from dvt.node_types import NodeType
+from dvt.runners import ExposureRunner as exposure_runner
+from dvt.runners import SavedQueryRunner as saved_query_runner
+from dvt.task.base import BaseRunner, resource_types_from_args
+from dvt.task.run import MicrobatchModelRunner
+from .function import FunctionRunner as function_runner
+from .run import ModelRunner as run_model_runner
+from .run import RunTask
+from .seed import SeedRunner as seed_runner
+from .snapshot import SnapshotRunner as snapshot_model_runner
+from .test import TestRunner as test_runner
+class BuildTask(RunTask):
+    """The Build task processes all assets of a given process and attempts to
+    'build' them in an opinionated fashion.  Every resource type outlined in
+    RUNNER_MAP will be processed by the mapped runners class.
+    I.E. a resource of type Model is handled by the ModelRunner which is
+    imported as run_model_runner."""
+    MARK_DEPENDENT_ERRORS_STATUSES = [
+        NodeStatus.Error,
+        NodeStatus.Fail,
+        NodeStatus.Skipped,
+        NodeStatus.PartialSuccess,
+    ]
+    RUNNER_MAP = {
+        NodeType.Model: run_model_runner,
+        NodeType.Snapshot: snapshot_model_runner,
+        NodeType.Seed: seed_runner,
+        NodeType.Test: test_runner,
+        NodeType.Unit: test_runner,
+        NodeType.SavedQuery: saved_query_runner,
+        NodeType.Exposure: exposure_runner,
+        NodeType.Function: function_runner,
+    }
+    ALL_RESOURCE_VALUES = frozenset({x for x in RUNNER_MAP.keys()})
+    def __init__(self, args: Flags, config: RuntimeConfig, manifest: Manifest) -> None:
+        super().__init__(args, config, manifest)
+        self.selected_unit_tests: Set = set()
+        self.model_to_unit_test_map: Dict[str, List] = {}
+    def resource_types(self, no_unit_tests: bool = False) -> List[NodeType]:
+        resource_types = resource_types_from_args(
+            self.args, set(self.ALL_RESOURCE_VALUES), set(self.ALL_RESOURCE_VALUES)
+        )
+        # First we get selected_nodes including unit tests, then without,
+        # and do a set difference.
+        if no_unit_tests is True and NodeType.Unit in resource_types:
+            resource_types.remove(NodeType.Unit)
+        return list(resource_types)
+    # overrides get_graph_queue in runnable.py
+    def get_graph_queue(self) -> GraphQueue:
+        # Following uses self.selection_arg and self.exclusion_arg
+        spec = self.get_selection_spec()
+        # selector including unit tests
+        full_selector = self.get_node_selector(no_unit_tests=False)
+        # selected node unique_ids with unit_tests
+        full_selected_nodes = full_selector.get_selected(spec)
+        # This selector removes the unit_tests from the selector
+        selector_wo_unit_tests = self.get_node_selector(no_unit_tests=True)
+        # selected node unique_ids without unit_tests
+        selected_nodes_wo_unit_tests = selector_wo_unit_tests.get_selected(spec)
+        # Get the difference in the sets of nodes with and without unit tests and
+        # save it
+        selected_unit_tests = full_selected_nodes - selected_nodes_wo_unit_tests
+        self.selected_unit_tests = selected_unit_tests
+        self.build_model_to_unit_test_map(selected_unit_tests)
+        # get_graph_queue in the selector will remove NodeTypes not specified
+        # in the node_selector (filter_selection).
+        return selector_wo_unit_tests.get_graph_queue(spec)
+    # overrides handle_job_queue in runnable.py
+    def handle_job_queue(self, pool, callback):
+        if self.run_count == 0:
+            self.num_nodes = self.num_nodes + len(self.selected_unit_tests)
+        node = self.job_queue.get()
+        if (
+            node.resource_type == NodeType.Model
+            and self.model_to_unit_test_map
+            and node.unique_id in self.model_to_unit_test_map
+        ):
+            self.handle_model_with_unit_tests_node(node, pool, callback)
+        else:
+            self.handle_job_queue_node(node, pool, callback)
+    def handle_model_with_unit_tests_node(self, node, pool, callback):
+        self._raise_set_error()
+        args = [node, pool]
+        if self.config.args.single_threaded:
+            callback(self.call_model_and_unit_tests_runner(*args))
+        else:
+            pool.apply_async(self.call_model_and_unit_tests_runner, args=args, callback=callback)
+    def call_model_and_unit_tests_runner(self, node, pool) -> RunResult:
+        assert self.manifest
+        for unit_test_unique_id in self.model_to_unit_test_map[node.unique_id]:
+            unit_test_node = self.manifest.unit_tests[unit_test_unique_id]
+            unit_test_runner = self.get_runner(unit_test_node)
+            # If the model is marked skip, also skip the unit tests
+            if node.unique_id in self._skipped_children:
+                # cause is only for ephemeral nodes
+                unit_test_runner.do_skip(cause=None)
+            result = self.call_runner(unit_test_runner)
+            self._handle_result(result)
+            if result.status in self.MARK_DEPENDENT_ERRORS_STATUSES:
+                # The _skipped_children dictionary can contain a run_result for ephemeral nodes,
+                # but that should never be the case here.
+                self._skipped_children[node.unique_id] = None
+        runner = self.get_runner(node)
+        if runner.node.unique_id in self._skipped_children:
+            cause = self._skipped_children.pop(runner.node.unique_id)
+            runner.do_skip(cause=cause)
+        if isinstance(runner, MicrobatchModelRunner):
+            runner.set_parent_task(self)
+            runner.set_pool(pool)
+        return self.call_runner(runner)
+    # handle non-model-plus-unit-tests nodes
+    def handle_job_queue_node(self, node, pool, callback):
+        self._raise_set_error()
+        runner = self.get_runner(node)
+        # we finally know what we're running! Make sure we haven't decided
+        # to skip it due to upstream failures
+        if runner.node.unique_id in self._skipped_children:
+            cause = self._skipped_children.pop(runner.node.unique_id)
+            runner.do_skip(cause=cause)
+        if isinstance(runner, MicrobatchModelRunner):
+            runner.set_parent_task(self)
+            runner.set_pool(pool)
+        args = [runner]
+        self._submit(pool, args, callback)
+    # Make a map of model unique_ids to selected unit test unique_ids,
+    # for processing before the model.
+    def build_model_to_unit_test_map(self, selected_unit_tests):
+        dct = {}
+        for unit_test_unique_id in selected_unit_tests:
+            unit_test = self.manifest.unit_tests[unit_test_unique_id]
+            model_unique_id = unit_test.depends_on.nodes[0]
+            if model_unique_id not in dct:
+                dct[model_unique_id] = []
+            dct[model_unique_id].append(unit_test.unique_id)
+        self.model_to_unit_test_map = dct
+    # We return two different kinds of selectors, one with unit tests and one without
+    def get_node_selector(self, no_unit_tests=False) -> ResourceTypeSelector:
+        if self.manifest is None or self.graph is None:
+            raise DbtInternalError("manifest and graph must be set to get node selection")
+        resource_types = self.resource_types(no_unit_tests)
+        return ResourceTypeSelector(
+            graph=self.graph,
+            manifest=self.manifest,
+            previous_state=self.previous_state,
+            resource_types=resource_types,
+        )
+    def get_runner_type(self, node) -> Optional[Type[BaseRunner]]:
+        if (
+            node.resource_type == NodeType.Model
+            and super().get_runner_type(node) == MicrobatchModelRunner
+        ):
+            return MicrobatchModelRunner
+        return self.RUNNER_MAP.get(node.resource_type)
+    # Special build compile_manifest method to pass add_test_edges to the compiler
+    def compile_manifest(self) -> None:
+        if self.manifest is None:
+            raise DbtInternalError("compile_manifest called before manifest was loaded")
+        self.graph: Graph = self.compiler.compile(self.manifest, add_test_edges=True)