PyPI - zenml-nightly - Versions diffs - 0.66.0.dev20240923__py3-none-any.whl → 0.66.0.dev20240924__py3-none-any.whl - Mend

zenml-nightly 0.66.0.dev20240923py3-none-any.whl → 0.66.0.dev20240924py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

zenml/VERSION +1 -1
zenml/cli/base.py +2 -2
zenml/cli/utils.py +14 -11
zenml/client.py +68 -3
zenml/config/step_configurations.py +0 -5
zenml/enums.py +2 -0
zenml/integrations/aws/flavors/sagemaker_orchestrator_flavor.py +76 -7
zenml/integrations/aws/orchestrators/sagemaker_orchestrator.py +81 -43
zenml/integrations/tensorboard/visualizers/tensorboard_visualizer.py +1 -1
zenml/models/v2/base/filter.py +315 -149
zenml/models/v2/base/scoped.py +5 -2
zenml/models/v2/core/artifact_version.py +69 -8
zenml/models/v2/core/model.py +43 -6
zenml/models/v2/core/model_version.py +49 -1
zenml/models/v2/core/model_version_artifact.py +18 -3
zenml/models/v2/core/model_version_pipeline_run.py +18 -4
zenml/models/v2/core/pipeline.py +108 -1
zenml/models/v2/core/pipeline_run.py +110 -20
zenml/models/v2/core/run_template.py +53 -1
zenml/models/v2/core/stack.py +33 -5
zenml/models/v2/core/step_run.py +7 -0
zenml/new/pipelines/pipeline.py +4 -0
zenml/utils/env_utils.py +54 -1
zenml/utils/string_utils.py +50 -0
zenml/zen_stores/sql_zen_store.py +1 -0
{zenml_nightly-0.66.0.dev20240923.dist-info → zenml_nightly-0.66.0.dev20240924.dist-info}/METADATA +1 -1
{zenml_nightly-0.66.0.dev20240923.dist-info → zenml_nightly-0.66.0.dev20240924.dist-info}/RECORD +30 -30
{zenml_nightly-0.66.0.dev20240923.dist-info → zenml_nightly-0.66.0.dev20240924.dist-info}/LICENSE +0 -0
{zenml_nightly-0.66.0.dev20240923.dist-info → zenml_nightly-0.66.0.dev20240924.dist-info}/WHEEL +0 -0
{zenml_nightly-0.66.0.dev20240923.dist-info → zenml_nightly-0.66.0.dev20240924.dist-info}/entry_points.txt +0 -0

zenml/integrations/aws/orchestrators/sagemaker_orchestrator.py CHANGED Viewed

@@ -25,7 +25,7 @@ from sagemaker.network import NetworkConfig
 from sagemaker.processing import ProcessingInput, ProcessingOutput
 from sagemaker.workflow.execution_variables import ExecutionVariables
 from sagemaker.workflow.pipeline import Pipeline
-from sagemaker.workflow.steps import ProcessingStep
+from sagemaker.workflow.steps import ProcessingStep, TrainingStep
 from zenml.config.base_settings import BaseSettings
 from zenml.constants import (
@@ -238,47 +238,61 @@ class SagemakerOrchestrator(ContainerizedOrchestrator):
                 ExecutionVariables.PIPELINE_EXECUTION_ARN
             )
-            # Retrieve Processor arguments provided in the Step settings.
-            processor_args_for_step = step_settings.processor_args or {}
+            use_training_step = (
+                step_settings.use_training_step
+                if step_settings.use_training_step is not None
+                else (
+                    self.config.use_training_step
+                    if self.config.use_training_step is not None
+                    else True
+                )
+            )
+            # Retrieve Executor arguments provided in the Step settings.
+            if use_training_step:
+                args_for_step_executor = step_settings.estimator_args or {}
+            else:
+                args_for_step_executor = step_settings.processor_args or {}
             # Set default values from configured orchestrator Component to arguments
             # to be used when they are not present in processor_args.
-            processor_args_for_step.setdefault(
-                "instance_type", step_settings.instance_type
-            )
-            processor_args_for_step.setdefault(
+            args_for_step_executor.setdefault(
                 "role",
-                step_settings.processor_role or self.config.execution_role,
+                step_settings.execution_role or self.config.execution_role,
             )
-            processor_args_for_step.setdefault(
+            args_for_step_executor.setdefault(
                 "volume_size_in_gb", step_settings.volume_size_in_gb
             )
-            processor_args_for_step.setdefault(
+            args_for_step_executor.setdefault(
                 "max_runtime_in_seconds", step_settings.max_runtime_in_seconds
             )
-            processor_args_for_step.setdefault(
+            tags = step_settings.tags
+            args_for_step_executor.setdefault(
                 "tags",
-                [
-                    {"Key": key, "Value": value}
-                    for key, value in step_settings.processor_tags.items()
-                ]
-                if step_settings.processor_tags
-                else None,
+                (
+                    [
+                        {"Key": key, "Value": value}
+                        for key, value in tags.items()
+                    ]
+                    if tags
+                    else None
+                ),
+            )
+            args_for_step_executor.setdefault(
+                "instance_type", step_settings.instance_type
             )
             # Set values that cannot be overwritten
-            processor_args_for_step["image_uri"] = image
-            processor_args_for_step["instance_count"] = 1
-            processor_args_for_step["sagemaker_session"] = session
-            processor_args_for_step["entrypoint"] = entrypoint
-            processor_args_for_step["base_job_name"] = orchestrator_run_name
-            processor_args_for_step["env"] = environment
+            args_for_step_executor["image_uri"] = image
+            args_for_step_executor["instance_count"] = 1
+            args_for_step_executor["sagemaker_session"] = session
+            args_for_step_executor["base_job_name"] = orchestrator_run_name
             # Convert network_config to sagemaker.network.NetworkConfig if present
-            network_config = processor_args_for_step.get("network_config")
+            network_config = args_for_step_executor.get("network_config")
             if network_config and isinstance(network_config, dict):
                 try:
-                    processor_args_for_step["network_config"] = NetworkConfig(
+                    args_for_step_executor["network_config"] = NetworkConfig(
                         **network_config
                     )
                 except TypeError:
@@ -317,17 +331,21 @@ class SagemakerOrchestrator(ContainerizedOrchestrator):
             # Construct S3 outputs from container for step
             outputs = None
+            output_path = None
             if step_settings.output_data_s3_uri is None:
                 pass
             elif isinstance(step_settings.output_data_s3_uri, str):
-                outputs = [
-                    ProcessingOutput(
-                        source="/opt/ml/processing/output/data",
-                        destination=step_settings.output_data_s3_uri,
-                        s3_upload_mode=step_settings.output_data_s3_mode,
-                    )
-                ]
+                if use_training_step:
+                    output_path = step_settings.output_data_s3_uri
+                else:
+                    outputs = [
+                        ProcessingOutput(
+                            source="/opt/ml/processing/output/data",
+                            destination=step_settings.output_data_s3_uri,
+                            s3_upload_mode=step_settings.output_data_s3_mode,
+                        )
+                    ]
             elif isinstance(step_settings.output_data_s3_uri, dict):
                 outputs = []
                 for (
@@ -342,17 +360,37 @@ class SagemakerOrchestrator(ContainerizedOrchestrator):
                         )
                     )
-            # Create Processor and ProcessingStep
-            processor = sagemaker.processing.Processor(
-                **processor_args_for_step
-            )
-            sagemaker_step = ProcessingStep(
-                name=step_name,
-                processor=processor,
-                depends_on=step.spec.upstream_steps,
-                inputs=inputs,
-                outputs=outputs,
-            )
+            if use_training_step:
+                # Create Estimator and TrainingStep
+                estimator = sagemaker.estimator.Estimator(
+                    keep_alive_period_in_seconds=step_settings.keep_alive_period_in_seconds,
+                    output_path=output_path,
+                    environment=environment,
+                    container_entry_point=entrypoint,
+                    **args_for_step_executor,
+                )
+                sagemaker_step = TrainingStep(
+                    name=step_name,
+                    depends_on=step.spec.upstream_steps,
+                    inputs=inputs,
+                    estimator=estimator,
+                )
+            else:
+                # Create Processor and ProcessingStep
+                processor = sagemaker.processing.Processor(
+                    entrypoint=entrypoint,
+                    env=environment,
+                    **args_for_step_executor,
+                )
+                sagemaker_step = ProcessingStep(
+                    name=step_name,
+                    processor=processor,
+                    depends_on=step.spec.upstream_steps,
+                    inputs=inputs,
+                    outputs=outputs,
+                )
             sagemaker_steps.append(sagemaker_step)
         # construct the pipeline from the sagemaker_steps

zenml/integrations/tensorboard/visualizers/tensorboard_visualizer.py CHANGED Viewed

@@ -194,7 +194,7 @@ def get_step(pipeline_name: str, step_name: str) -> "StepRunResponse":
     Raises:
         RuntimeError: If the step is not found.
     """
-    runs = Client().list_pipeline_runs(pipeline_name=pipeline_name)
+    runs = Client().list_pipeline_runs(pipeline=pipeline_name)
     if runs.total == 0:
         raise RuntimeError(
             f"No pipeline runs for pipeline `{pipeline_name}` were found"

zenml-nightly 0.66.0.dev20240923__py3-none-any.whl → 0.66.0.dev20240924__py3-none-any.whl

zenml-nightly 0.66.0.dev20240923py3-none-any.whl → 0.66.0.dev20240924py3-none-any.whl