PyPI - runnable - Versions diffs - 0.17.1__py3-none-any.whl → 0.19.0__py3-none-any.whl - Mend

runnable 0.17.1py3-none-any.whl → 0.19.0py3-none-any.whl

Files changed (47) hide show

extensions/README.md +0 -0
extensions/__init__.py +0 -0
extensions/catalog/README.md +0 -0
extensions/catalog/file_system.py +253 -0
extensions/catalog/pyproject.toml +14 -0
extensions/job_executor/README.md +0 -0
extensions/job_executor/__init__.py +160 -0
extensions/job_executor/k8s.py +484 -0
extensions/job_executor/k8s_job_spec.yaml +37 -0
extensions/job_executor/local.py +61 -0
extensions/job_executor/local_container.py +192 -0
extensions/job_executor/pyproject.toml +16 -0
extensions/nodes/README.md +0 -0
extensions/nodes/nodes.py +954 -0
extensions/nodes/pyproject.toml +15 -0
extensions/pipeline_executor/README.md +0 -0
extensions/pipeline_executor/__init__.py +644 -0
extensions/pipeline_executor/argo.py +1307 -0
extensions/pipeline_executor/argo_specification.yaml +51 -0
extensions/pipeline_executor/local.py +62 -0
extensions/pipeline_executor/local_container.py +362 -0
extensions/pipeline_executor/mocked.py +161 -0
extensions/pipeline_executor/pyproject.toml +16 -0
extensions/pipeline_executor/retry.py +180 -0
extensions/run_log_store/README.md +0 -0
extensions/run_log_store/__init__.py +0 -0
extensions/run_log_store/chunked_fs.py +113 -0
extensions/run_log_store/db/implementation_FF.py +163 -0
extensions/run_log_store/db/integration_FF.py +0 -0
extensions/run_log_store/file_system.py +145 -0
extensions/run_log_store/generic_chunked.py +599 -0
extensions/run_log_store/pyproject.toml +15 -0
extensions/secrets/README.md +0 -0
extensions/secrets/dotenv.py +62 -0
extensions/secrets/pyproject.toml +15 -0
runnable/__init__.py +1 -0
runnable/catalog.py +1 -2
runnable/entrypoints.py +1 -5
runnable/executor.py +1 -1
runnable/parameters.py +0 -9
runnable/utils.py +5 -25
{runnable-0.17.1.dist-info → runnable-0.19.0.dist-info}/METADATA +1 -7
runnable-0.19.0.dist-info/RECORD +58 -0
{runnable-0.17.1.dist-info → runnable-0.19.0.dist-info}/entry_points.txt +1 -0
runnable-0.17.1.dist-info/RECORD +0 -23
{runnable-0.17.1.dist-info → runnable-0.19.0.dist-info}/WHEEL +0 -0
{runnable-0.17.1.dist-info → runnable-0.19.0.dist-info}/licenses/LICENSE +0 -0

extensions/pipeline_executor/argo.py ADDED Viewed

@@ -0,0 +1,1307 @@
+import json
+import logging
+import random
+import shlex
+import string
+from abc import ABC, abstractmethod
+from collections import OrderedDict
+from typing import Dict, List, Optional, Union, cast
+from pydantic import (
+    BaseModel,
+    ConfigDict,
+    Field,
+    computed_field,
+    field_serializer,
+    field_validator,
+)
+from pydantic.functional_serializers import PlainSerializer
+from ruamel.yaml import YAML
+from typing_extensions import Annotated
+from extensions.nodes.nodes import DagNode, MapNode, ParallelNode
+from extensions.pipeline_executor import GenericPipelineExecutor
+from runnable import defaults, exceptions, utils
+from runnable.defaults import TypeMapVariable
+from runnable.graph import Graph, create_node, search_node_by_internal_name
+from runnable.nodes import BaseNode
+logger = logging.getLogger(defaults.NAME)
+# TODO: Leave the run log in consistent state.
+# TODO: Make the config camel case just like Argo does.
+"""
+executor:
+  type: argo
+  config:
+    image: # apply to template
+    max_workflow_duration: # Apply to spec
+    nodeSelector: #Apply to spec
+    parallelism: #apply to spec
+    resources: # convert to podSpecPath
+      limits:
+      requests:
+    retryStrategy:
+    max_step_duration: # apply to templateDefaults
+    step_timeout: # apply to templateDefaults
+    tolerations: # apply to spec
+    imagePullPolicy: # apply to template
+    overrides:
+      override:
+        tolerations: # template
+        image: # container
+        max_step_duration: # template
+        step_timeout: #template
+        nodeSelector: #template
+        parallelism: # this need to applied for map
+        resources: # container
+        imagePullPolicy: #container
+        retryStrategy: # template
+"""
+class SecretEnvVar(BaseModel):
+    """
+    Renders:
+    env:
+      - name: MYSECRETPASSWORD
+        valueFrom:
+          secretKeyRef:
+            name: my-secret
+            key: mypassword
+    """
+    environment_variable: str = Field(serialization_alias="name")
+    secret_name: str = Field(exclude=True)
+    secret_key: str = Field(exclude=True)
+    @computed_field  # type: ignore
+    @property
+    def valueFrom(self) -> Dict[str, Dict[str, str]]:
+        return {
+            "secretKeyRef": {
+                "name": self.secret_name,
+                "key": self.secret_key,
+            }
+        }
+class EnvVar(BaseModel):
+    """
+    Renders:
+    parameters: # in arguments
+      - name: x
+        value: 3 # This is optional for workflow parameters
+    """
+    name: str
+    value: Union[str, int, float] = Field(default="")
+class Parameter(BaseModel):
+    name: str
+    value: Optional[str] = None
+    @field_serializer("name")
+    def serialize_name(self, name: str) -> str:
+        return f"{str(name)}"
+    @field_serializer("value")
+    def serialize_value(self, value: str) -> str:
+        return f"{value}"
+class OutputParameter(Parameter):
+    """
+    Renders:
+    - name: step-name
+      valueFrom:
+        path: /tmp/output.txt
+    """
+    path: str = Field(default="/tmp/output.txt", exclude=True)
+    @computed_field  # type: ignore
+    @property
+    def valueFrom(self) -> Dict[str, str]:
+        return {"path": self.path}
+class Argument(BaseModel):
+    """
+    Templates are called with arguments, which become inputs for the template
+    Renders:
+    arguments:
+      parameters:
+        - name: The name of the parameter
+          value: The value of the parameter
+    """
+    name: str
+    value: str
+    @field_serializer("name")
+    def serialize_name(self, name: str) -> str:
+        return f"{str(name)}"
+    @field_serializer("value")
+    def serialize_value(self, value: str) -> str:
+        return f"{value}"
+class Request(BaseModel):
+    """
+    The default requests
+    """
+    memory: str = "1Gi"
+    cpu: str = "250m"
+VendorGPU = Annotated[
+    Optional[int],
+    PlainSerializer(lambda x: str(x), return_type=str, when_used="unless-none"),
+]
+class Limit(Request):
+    """
+    The default limits
+    """
+    gpu: VendorGPU = Field(default=None, serialization_alias="nvidia.com/gpu")
+class Resources(BaseModel):
+    limits: Limit = Field(default=Limit(), serialization_alias="limits")
+    requests: Request = Field(default=Request(), serialization_alias="requests")
+class BackOff(BaseModel):
+    duration_in_seconds: int = Field(default=2 * 60, serialization_alias="duration")
+    factor: float = Field(default=2, serialization_alias="factor")
+    max_duration: int = Field(default=60 * 60, serialization_alias="maxDuration")
+    @field_serializer("duration_in_seconds")
+    def cast_duration_as_str(self, duration_in_seconds: int, _info) -> str:
+        return str(duration_in_seconds)
+    @field_serializer("max_duration")
+    def cast_mas_duration_as_str(self, max_duration: int, _info) -> str:
+        return str(max_duration)
+class Retry(BaseModel):
+    limit: int = 0
+    retry_policy: str = Field(default="Always", serialization_alias="retryPolicy")
+    back_off: BackOff = Field(default=BackOff(), serialization_alias="backoff")
+    @field_serializer("limit")
+    def cast_limit_as_str(self, limit: int, _info) -> str:
+        return str(limit)
+class Toleration(BaseModel):
+    effect: str
+    key: str
+    operator: str
+    value: str
+class TemplateDefaults(BaseModel):
+    max_step_duration: int = Field(
+        default=60 * 60 * 2,
+        serialization_alias="activeDeadlineSeconds",
+        gt=0,
+        description="Max run time of a step",
+    )
+    @computed_field  # type: ignore
+    @property
+    def timeout(self) -> str:
+        return f"{self.max_step_duration + 60*60}s"
+ShlexCommand = Annotated[
+    str, PlainSerializer(lambda x: shlex.split(x), return_type=List[str])
+]
+class Container(BaseModel):
+    image: str
+    command: ShlexCommand
+    volume_mounts: Optional[List["ContainerVolume"]] = Field(
+        default=None, serialization_alias="volumeMounts"
+    )
+    image_pull_policy: str = Field(default="", serialization_alias="imagePullPolicy")
+    resources: Optional[Resources] = Field(
+        default=None, serialization_alias="resources"
+    )
+    env_vars: List[EnvVar] = Field(default_factory=list, exclude=True)
+    secrets_from_k8s: List[SecretEnvVar] = Field(default_factory=list, exclude=True)
+    @computed_field  # type: ignore
+    @property
+    def env(self) -> Optional[List[Union[EnvVar, SecretEnvVar]]]:
+        if not self.env_vars and not self.secrets_from_k8s:
+            return None
+        return self.env_vars + self.secrets_from_k8s
+class DagTaskTemplate(BaseModel):
+    """
+    dag:
+        tasks:
+          name: A
+            template: nested-diamond
+            arguments:
+                parameters: [{name: message, value: A}]
+    """
+    name: str
+    template: str
+    depends: List[str] = []
+    arguments: Optional[List[Argument]] = Field(default=None)
+    with_param: Optional[str] = Field(default=None, serialization_alias="withParam")
+    @field_serializer("depends")
+    def transform_depends_as_str(self, depends: List[str]) -> str:
+        return " || ".join(depends)
+    @field_serializer("arguments", when_used="unless-none")
+    def empty_arguments_to_none(
+        self, arguments: List[Argument]
+    ) -> Dict[str, List[Argument]]:
+        return {"parameters": arguments}
+class ContainerTemplate(BaseModel):
+    # These templates are used for actual execution nodes.
+    name: str
+    active_deadline_seconds: Optional[int] = Field(
+        default=None, serialization_alias="activeDeadlineSeconds", gt=0
+    )
+    node_selector: Optional[Dict[str, str]] = Field(
+        default=None, serialization_alias="nodeSelector"
+    )
+    retry_strategy: Optional[Retry] = Field(
+        default=None, serialization_alias="retryStrategy"
+    )
+    tolerations: Optional[List[Toleration]] = Field(
+        default=None, serialization_alias="tolerations"
+    )
+    container: Container
+    outputs: Optional[List[OutputParameter]] = Field(
+        default=None, serialization_alias="outputs"
+    )
+    inputs: Optional[List[Parameter]] = Field(
+        default=None, serialization_alias="inputs"
+    )
+    def __hash__(self):
+        return hash(self.name)
+    @field_serializer("outputs", when_used="unless-none")
+    def reshape_outputs(
+        self, outputs: List[OutputParameter]
+    ) -> Dict[str, List[OutputParameter]]:
+        return {"parameters": outputs}
+    @field_serializer("inputs", when_used="unless-none")
+    def reshape_inputs(self, inputs: List[Parameter]) -> Dict[str, List[Parameter]]:
+        return {"parameters": inputs}
+class DagTemplate(BaseModel):
+    # These are used for parallel, map nodes dag definition
+    name: str = "runnable-dag"
+    tasks: List[DagTaskTemplate] = Field(default=[], exclude=True)
+    inputs: Optional[List[Parameter]] = Field(
+        default=None, serialization_alias="inputs"
+    )
+    parallelism: Optional[int] = None
+    fail_fast: bool = Field(default=False, serialization_alias="failFast")
+    @field_validator("parallelism")
+    @classmethod
+    def validate_parallelism(cls, parallelism: Optional[int]) -> Optional[int]:
+        if parallelism is not None and parallelism <= 0:
+            raise ValueError("Parallelism must be a positive integer greater than 0")
+        return parallelism
+    @computed_field  # type: ignore
+    @property
+    def dag(self) -> Dict[str, List[DagTaskTemplate]]:
+        return {"tasks": self.tasks}
+    @field_serializer("inputs", when_used="unless-none")
+    def reshape_inputs(
+        self, inputs: List[Parameter], _info
+    ) -> Dict[str, List[Parameter]]:
+        return {"parameters": inputs}
+class Volume(BaseModel):
+    """
+    spec config requires, name and persistentVolumeClaim
+    step requires name and mountPath
+    """
+    name: str
+    claim: str = Field(exclude=True)
+    mount_path: str = Field(serialization_alias="mountPath", exclude=True)
+    @computed_field  # type: ignore
+    @property
+    def persistentVolumeClaim(self) -> Dict[str, str]:
+        return {"claimName": self.claim}
+class ContainerVolume(BaseModel):
+    name: str
+    mount_path: str = Field(serialization_alias="mountPath")
+class UserVolumeMounts(BaseModel):
+    """
+    The volume specification as user defines it.
+    """
+    name: str  # This is the name of the PVC on K8s
+    mount_path: str  # This is mount path on the container
+class NodeRenderer(ABC):
+    allowed_node_types: List[str] = []
+    def __init__(self, executor: "ArgoExecutor", node: BaseNode) -> None:
+        self.executor = executor
+        self.node = node
+    @abstractmethod
+    def render(self, list_of_iter_values: Optional[List] = None):
+        pass
+class ExecutionNode(NodeRenderer):
+    allowed_node_types = ["task", "stub", "success", "fail"]
+    def render(self, list_of_iter_values: Optional[List] = None):
+        """
+        Compose the map variable and create the execution command.
+        Create an input to the command.
+        create_container_template : creates an argument for the list of iter values
+        """
+        map_variable = self.executor.compose_map_variable(list_of_iter_values)
+        command = utils.get_node_execution_command(
+            self.node,
+            over_write_run_id=self.executor._run_id_placeholder,
+            map_variable=map_variable,
+            log_level=self.executor._log_level,
+        )
+        inputs = []
+        if list_of_iter_values:
+            for val in list_of_iter_values:
+                inputs.append(Parameter(name=val))
+        # Create the container template
+        container_template = self.executor.create_container_template(
+            working_on=self.node,
+            command=command,
+            inputs=inputs,
+        )
+        self.executor._container_templates.append(container_template)
+class DagNodeRenderer(NodeRenderer):
+    allowed_node_types = ["dag"]
+    def render(self, list_of_iter_values: Optional[List] = None):
+        self.node = cast(DagNode, self.node)
+        task_template_arguments = []
+        dag_inputs = []
+        if list_of_iter_values:
+            for value in list_of_iter_values:
+                task_template_arguments.append(
+                    Argument(name=value, value="{{inputs.parameters." + value + "}}")
+                )
+                dag_inputs.append(Parameter(name=value))
+        clean_name = self.executor.get_clean_name(self.node)
+        fan_out_template = self.executor._create_fan_out_template(
+            composite_node=self.node, list_of_iter_values=list_of_iter_values
+        )
+        fan_out_template.arguments = (
+            task_template_arguments if task_template_arguments else None
+        )
+        fan_in_template = self.executor._create_fan_in_template(
+            composite_node=self.node, list_of_iter_values=list_of_iter_values
+        )
+        fan_in_template.arguments = (
+            task_template_arguments if task_template_arguments else None
+        )
+        self.executor._gather_task_templates_of_dag(
+            self.node.branch,
+            dag_name=f"{clean_name}-branch",
+            list_of_iter_values=list_of_iter_values,
+        )
+        branch_template = DagTaskTemplate(
+            name=f"{clean_name}-branch",
+            template=f"{clean_name}-branch",
+            arguments=task_template_arguments if task_template_arguments else None,
+        )
+        branch_template.depends.append(f"{clean_name}-fan-out.Succeeded")
+        fan_in_template.depends.append(f"{clean_name}-branch.Succeeded")
+        fan_in_template.depends.append(f"{clean_name}-branch.Failed")
+        self.executor._dag_templates.append(
+            DagTemplate(
+                tasks=[fan_out_template, branch_template, fan_in_template],
+                name=clean_name,
+                inputs=dag_inputs if dag_inputs else None,
+            )
+        )
+class ParallelNodeRender(NodeRenderer):
+    allowed_node_types = ["parallel"]
+    def render(self, list_of_iter_values: Optional[List] = None):
+        self.node = cast(ParallelNode, self.node)
+        task_template_arguments = []
+        dag_inputs = []
+        if list_of_iter_values:
+            for value in list_of_iter_values:
+                task_template_arguments.append(
+                    Argument(name=value, value="{{inputs.parameters." + value + "}}")
+                )
+                dag_inputs.append(Parameter(name=value))
+        clean_name = self.executor.get_clean_name(self.node)
+        fan_out_template = self.executor._create_fan_out_template(
+            composite_node=self.node, list_of_iter_values=list_of_iter_values
+        )
+        fan_out_template.arguments = (
+            task_template_arguments if task_template_arguments else None
+        )
+        fan_in_template = self.executor._create_fan_in_template(
+            composite_node=self.node, list_of_iter_values=list_of_iter_values
+        )
+        fan_in_template.arguments = (
+            task_template_arguments if task_template_arguments else None
+        )
+        branch_templates = []
+        for name, branch in self.node.branches.items():
+            branch_name = self.executor.sanitize_name(name)
+            self.executor._gather_task_templates_of_dag(
+                branch,
+                dag_name=f"{clean_name}-{branch_name}",
+                list_of_iter_values=list_of_iter_values,
+            )
+            task_template = DagTaskTemplate(
+                name=f"{clean_name}-{branch_name}",
+                template=f"{clean_name}-{branch_name}",
+                arguments=task_template_arguments if task_template_arguments else None,
+            )
+            task_template.depends.append(f"{clean_name}-fan-out.Succeeded")
+            fan_in_template.depends.append(f"{task_template.name}.Succeeded")
+            fan_in_template.depends.append(f"{task_template.name}.Failed")
+            branch_templates.append(task_template)
+        executor_config = self.executor._resolve_executor_config(self.node)
+        self.executor._dag_templates.append(
+            DagTemplate(
+                tasks=[fan_out_template] + branch_templates + [fan_in_template],
+                name=clean_name,
+                inputs=dag_inputs if dag_inputs else None,
+                parallelism=executor_config.get("parallelism", None),
+            )
+        )
+class MapNodeRender(NodeRenderer):
+    allowed_node_types = ["map"]
+    def render(self, list_of_iter_values: Optional[List] = None):
+        self.node = cast(MapNode, self.node)
+        task_template_arguments = []
+        dag_inputs = []
+        if not list_of_iter_values:
+            list_of_iter_values = []
+        for value in list_of_iter_values:
+            task_template_arguments.append(
+                Argument(name=value, value="{{inputs.parameters." + value + "}}")
+            )
+            dag_inputs.append(Parameter(name=value))
+        clean_name = self.executor.get_clean_name(self.node)
+        fan_out_template = self.executor._create_fan_out_template(
+            composite_node=self.node, list_of_iter_values=list_of_iter_values
+        )
+        fan_out_template.arguments = (
+            task_template_arguments if task_template_arguments else None
+        )
+        fan_in_template = self.executor._create_fan_in_template(
+            composite_node=self.node, list_of_iter_values=list_of_iter_values
+        )
+        fan_in_template.arguments = (
+            task_template_arguments if task_template_arguments else None
+        )
+        list_of_iter_values.append(self.node.iterate_as)
+        self.executor._gather_task_templates_of_dag(
+            self.node.branch,
+            dag_name=f"{clean_name}-map",
+            list_of_iter_values=list_of_iter_values,
+        )
+        task_template = DagTaskTemplate(
+            name=f"{clean_name}-map",
+            template=f"{clean_name}-map",
+            arguments=task_template_arguments if task_template_arguments else None,
+        )
+        task_template.with_param = (
+            "{{tasks."
+            + f"{clean_name}-fan-out"
+            + ".outputs.parameters."
+            + "iterate-on"
+            + "}}"
+        )
+        argument = Argument(name=self.node.iterate_as, value="{{item}}")
+        if task_template.arguments is None:
+            task_template.arguments = []
+        task_template.arguments.append(argument)
+        task_template.depends.append(f"{clean_name}-fan-out.Succeeded")
+        fan_in_template.depends.append(f"{clean_name}-map.Succeeded")
+        fan_in_template.depends.append(f"{clean_name}-map.Failed")
+        executor_config = self.executor._resolve_executor_config(self.node)
+        self.executor._dag_templates.append(
+            DagTemplate(
+                tasks=[fan_out_template, task_template, fan_in_template],
+                name=clean_name,
+                inputs=dag_inputs if dag_inputs else None,
+                parallelism=executor_config.get("parallelism", None),
+                fail_fast=executor_config.get("fail_fast", True),
+            )
+        )
+def get_renderer(node):
+    renderers = NodeRenderer.__subclasses__()
+    for renderer in renderers:
+        if node.node_type in renderer.allowed_node_types:
+            return renderer
+    raise Exception("This node type is not render-able")
+class MetaData(BaseModel):
+    generate_name: str = Field(
+        default="runnable-dag-", serialization_alias="generateName"
+    )
+    # The type ignore is related to: https://github.com/python/mypy/issues/18191
+    annotations: Optional[Dict[str, str]] = Field(default_factory=dict)  # type: ignore
+    labels: Optional[Dict[str, str]] = Field(default_factory=dict)  # type: ignore
+    namespace: Optional[str] = Field(default=None)
+class Spec(BaseModel):
+    active_deadline_seconds: int = Field(serialization_alias="activeDeadlineSeconds")
+    entrypoint: str = Field(default="runnable-dag")
+    node_selector: Optional[Dict[str, str]] = Field(
+        default_factory=dict,  # type: ignore
+        serialization_alias="nodeSelector",
+    )
+    tolerations: Optional[List[Toleration]] = Field(
+        default=None, serialization_alias="tolerations"
+    )
+    parallelism: Optional[int] = Field(default=None, serialization_alias="parallelism")
+    # TODO: This has to be user driven
+    pod_gc: Dict[str, str] = Field(  # type ignore
+        default={"strategy": "OnPodSuccess", "deleteDelayDuration": "600s"},
+        serialization_alias="podGC",
+    )
+    retry_strategy: Retry = Field(default=Retry(), serialization_alias="retryStrategy")
+    service_account_name: Optional[str] = Field(
+        default=None, serialization_alias="serviceAccountName"
+    )
+    templates: List[Union[DagTemplate, ContainerTemplate]] = Field(default_factory=list)
+    template_defaults: Optional[TemplateDefaults] = Field(
+        default=None, serialization_alias="templateDefaults"
+    )
+    arguments: Optional[List[EnvVar]] = Field(default_factory=list)  # type: ignore
+    persistent_volumes: List[UserVolumeMounts] = Field(
+        default_factory=list, exclude=True
+    )
+    @field_validator("parallelism")
+    @classmethod
+    def validate_parallelism(cls, parallelism: Optional[int]) -> Optional[int]:
+        if parallelism is not None and parallelism <= 0:
+            raise ValueError("Parallelism must be a positive integer greater than 0")
+        return parallelism
+    @computed_field  # type: ignore
+    @property
+    def volumes(self) -> List[Volume]:
+        volumes: List[Volume] = []
+        claim_names = {}
+        for i, user_volume in enumerate(self.persistent_volumes):
+            if user_volume.name in claim_names:
+                raise Exception(f"Duplicate claim name {user_volume.name}")
+            claim_names[user_volume.name] = user_volume.name
+            volume = Volume(
+                name=f"executor-{i}",
+                claim=user_volume.name,
+                mount_path=user_volume.mount_path,
+            )
+            volumes.append(volume)
+        return volumes
+    @field_serializer("arguments", when_used="unless-none")
+    def reshape_arguments(
+        self, arguments: List[EnvVar], _info
+    ) -> Dict[str, List[EnvVar]]:
+        return {"parameters": arguments}
+class Workflow(BaseModel):
+    api_version: str = Field(
+        default="argoproj.io/v1alpha1",
+        serialization_alias="apiVersion",
+    )
+    kind: str = "Workflow"
+    metadata: MetaData = Field(default=MetaData())
+    spec: Spec
+class Override(BaseModel):
+    model_config = ConfigDict(extra="ignore")
+    image: str
+    tolerations: Optional[List[Toleration]] = Field(default=None)
+    max_step_duration_in_seconds: int = Field(
+        default=2 * 60 * 60,  # 2 hours
+        gt=0,
+    )
+    node_selector: Optional[Dict[str, str]] = Field(
+        default=None,
+        serialization_alias="nodeSelector",
+    )
+    parallelism: Optional[int] = Field(
+        default=None,
+        serialization_alias="parallelism",
+    )
+    resources: Resources = Field(
+        default=Resources(),
+        serialization_alias="resources",
+    )
+    image_pull_policy: str = Field(default="")
+    retry_strategy: Retry = Field(
+        default=Retry(),
+        serialization_alias="retryStrategy",
+        description="Common across all templates",
+    )
+    @field_validator("parallelism")
+    @classmethod
+    def validate_parallelism(cls, parallelism: Optional[int]) -> Optional[int]:
+        if parallelism is not None and parallelism <= 0:
+            raise ValueError("Parallelism must be a positive integer greater than 0")
+        return parallelism
+class ArgoExecutor(GenericPipelineExecutor):
+    service_name: str = "argo"
+    _is_local: bool = False
+    # TODO: Add logging level as option.
+    model_config = ConfigDict(extra="forbid")
+    image: str
+    expose_parameters_as_inputs: bool = True
+    secrets_from_k8s: List[SecretEnvVar] = Field(default_factory=list)
+    output_file: str = "argo-pipeline.yaml"
+    # Metadata related fields
+    name: str = Field(
+        default="runnable-dag-", description="Used as an identifier for the workflow"
+    )
+    annotations: Dict[str, str] = Field(default_factory=dict)
+    labels: Dict[str, str] = Field(default_factory=dict)
+    max_workflow_duration_in_seconds: int = Field(
+        2 * 24 * 60 * 60,  # 2 days
+        serialization_alias="activeDeadlineSeconds",
+        gt=0,
+    )
+    node_selector: Optional[Dict[str, str]] = Field(
+        default=None,
+        serialization_alias="nodeSelector",
+    )
+    parallelism: Optional[int] = Field(
+        default=None,
+        serialization_alias="parallelism",
+    )
+    resources: Resources = Field(
+        default=Resources(),
+        serialization_alias="resources",
+        exclude=True,
+    )
+    retry_strategy: Retry = Field(
+        default=Retry(),
+        serialization_alias="retryStrategy",
+        description="Common across all templates",
+    )
+    max_step_duration_in_seconds: int = Field(
+        default=2 * 60 * 60,  # 2 hours
+        gt=0,
+    )
+    tolerations: Optional[List[Toleration]] = Field(default=None)
+    image_pull_policy: str = Field(default="")
+    service_account_name: Optional[str] = None
+    persistent_volumes: List[UserVolumeMounts] = Field(default_factory=list)
+    _run_id_placeholder: str = "{{workflow.parameters.run_id}}"
+    _log_level: str = "{{workflow.parameters.log_level}}"
+    _container_templates: List[ContainerTemplate] = []
+    _dag_templates: List[DagTemplate] = []
+    _clean_names: Dict[str, str] = {}
+    _container_volumes: List[ContainerVolume] = []
+    @field_validator("parallelism")
+    @classmethod
+    def validate_parallelism(cls, parallelism: Optional[int]) -> Optional[int]:
+        if parallelism is not None and parallelism <= 0:
+            raise ValueError("Parallelism must be a positive integer greater than 0")
+        return parallelism
+    @computed_field  # type: ignore
+    @property
+    def step_timeout(self) -> int:
+        """
+        Maximum time the step can take to complete, including the pending state.
+        """
+        return (
+            self.max_step_duration_in_seconds + 2 * 60 * 60
+        )  # 2 hours + max_step_duration_in_seconds
+    @property
+    def metadata(self) -> MetaData:
+        return MetaData(
+            generate_name=self.name,
+            annotations=self.annotations,
+            labels=self.labels,
+        )
+    @property
+    def spec(self) -> Spec:
+        return Spec(
+            active_deadline_seconds=self.max_workflow_duration_in_seconds,
+            node_selector=self.node_selector,
+            tolerations=self.tolerations,
+            parallelism=self.parallelism,
+            retry_strategy=self.retry_strategy,
+            service_account_name=self.service_account_name,
+            persistent_volumes=self.persistent_volumes,
+            template_defaults=TemplateDefaults(
+                max_step_duration=self.max_step_duration_in_seconds
+            ),
+        )
+    # TODO: This has to move to execute_node?
+    def prepare_for_execution(self):
+        """
+        Perform any modifications to the services prior to execution of the node.
+        Args:
+            node (Node): [description]
+            map_variable (dict, optional): [description]. Defaults to None.
+        """
+        self._set_up_run_log(exists_ok=True)
+    def execute_node(
+        self, node: BaseNode, map_variable: TypeMapVariable = None, **kwargs
+    ):
+        step_log = self._context.run_log_store.create_step_log(
+            node.name, node._get_step_log_name(map_variable)
+        )
+        self.add_code_identities(node=node, step_log=step_log)
+        step_log.step_type = node.node_type
+        step_log.status = defaults.PROCESSING
+        self._context.run_log_store.add_step_log(step_log, self._context.run_id)
+        super()._execute_node(node, map_variable=map_variable, **kwargs)
+        # Implicit fail
+        if self._context.dag:
+            # functions and notebooks do not have dags
+            _, current_branch = search_node_by_internal_name(
+                dag=self._context.dag, internal_name=node.internal_name
+            )
+            _, next_node_name = self._get_status_and_next_node_name(
+                node, current_branch, map_variable=map_variable
+            )
+            if next_node_name:
+                # Terminal nodes do not have next node name
+                next_node = current_branch.get_node_by_name(next_node_name)
+                if next_node.node_type == defaults.FAIL:
+                    self.execute_node(next_node, map_variable=map_variable)
+        step_log = self._context.run_log_store.get_step_log(
+            node._get_step_log_name(map_variable), self._context.run_id
+        )
+        if step_log.status == defaults.FAIL:
+            raise Exception(f"Step {node.name} failed")
+    def fan_out(self, node: BaseNode, map_variable: TypeMapVariable = None):
+        super().fan_out(node, map_variable)
+        # If its a map node, write the list values to "/tmp/output.txt"
+        if node.node_type == "map":
+            node = cast(MapNode, node)
+            iterate_on = self._context.run_log_store.get_parameters(
+                self._context.run_id
+            )[node.iterate_on]
+            with open("/tmp/output.txt", mode="w", encoding="utf-8") as myfile:
+                json.dump(iterate_on.get_value(), myfile, indent=4)
+    def sanitize_name(self, name):
+        return name.replace(" ", "-").replace(".", "-").replace("_", "-")
+    def get_clean_name(self, node: BaseNode):
+        # Cache names for the node
+        if node.internal_name not in self._clean_names:
+            sanitized = self.sanitize_name(node.name)
+            tag = "".join(random.choices(string.ascii_lowercase + string.digits, k=6))
+            self._clean_names[node.internal_name] = (
+                f"{sanitized}-{node.node_type}-{tag}"
+            )
+        return self._clean_names[node.internal_name]
+    def compose_map_variable(
+        self, list_of_iter_values: Optional[List] = None
+    ) -> TypeMapVariable:
+        map_variable = OrderedDict()
+        # If we are inside a map node, compose a map_variable
+        # The values of "iterate_as" are sent over as inputs to the container template
+        if list_of_iter_values:
+            for var in list_of_iter_values:
+                map_variable[var] = "{{inputs.parameters." + str(var) + "}}"
+        return map_variable  # type: ignore
+    def create_container_template(
+        self,
+        working_on: BaseNode,
+        command: str,
+        inputs: Optional[List] = None,
+        outputs: Optional[List] = None,
+        overwrite_name: str = "",
+    ):
+        effective_node_config = self._resolve_executor_config(working_on)
+        override: Override = Override(**effective_node_config)
+        container = Container(
+            command=command,
+            image=override.image,
+            volume_mounts=self._container_volumes,
+            image_pull_policy=override.image_pull_policy,
+            resources=override.resources,
+            secrets_from_k8s=self.secrets_from_k8s,
+        )
+        if (
+            working_on.name == self._context.dag.start_at
+            and self.expose_parameters_as_inputs
+        ):
+            for key, value in self._get_parameters().items():
+                value = value.get_value()  # type: ignore
+                # Get the value from work flow parameters for dynamic behavior
+                if (
+                    isinstance(value, int)
+                    or isinstance(value, float)
+                    or isinstance(value, str)
+                ):
+                    env_var = EnvVar(
+                        name=defaults.PARAMETER_PREFIX + key,
+                        value="{{workflow.parameters." + key + "}}",
+                    )
+                    container.env_vars.append(env_var)
+        clean_name = self.get_clean_name(working_on)
+        if overwrite_name:
+            clean_name = overwrite_name
+        container_template = ContainerTemplate(
+            name=clean_name,
+            active_deadline_seconds=(
+                override.max_step_duration_in_seconds
+                if self.max_step_duration_in_seconds
+                != override.max_step_duration_in_seconds
+                else None
+            ),
+            container=container,
+            retry_strategy=override.retry_strategy
+            if self.retry_strategy != override.retry_strategy
+            else None,
+            tolerations=override.tolerations
+            if self.tolerations != override.tolerations
+            else None,
+            node_selector=override.node_selector
+            if self.node_selector != override.node_selector
+            else None,
+        )
+        # inputs are the "iterate_as" value map variables in the same order as they are observed
+        # We need to expose the map variables in the command of the container
+        if inputs:
+            if not container_template.inputs:
+                container_template.inputs = []
+            container_template.inputs.extend(inputs)
+        # The map step fan out would create an output that we should propagate via Argo
+        if outputs:
+            if not container_template.outputs:
+                container_template.outputs = []
+            container_template.outputs.extend(outputs)
+        return container_template
+    def _create_fan_out_template(
+        self, composite_node, list_of_iter_values: Optional[List] = None
+    ):
+        clean_name = self.get_clean_name(composite_node)
+        inputs = []
+        # If we are fanning out already map state, we need to send the map variable inside
+        # The container template also should be accepting an input parameter
+        map_variable = None
+        if list_of_iter_values:
+            map_variable = self.compose_map_variable(
+                list_of_iter_values=list_of_iter_values
+            )
+            for val in list_of_iter_values:
+                inputs.append(Parameter(name=val))
+        command = utils.get_fan_command(
+            mode="out",
+            node=composite_node,
+            run_id=self._run_id_placeholder,
+            map_variable=map_variable,
+            log_level=self._log_level,
+        )
+        outputs = []
+        # If the node is a map node, we have to set the output parameters
+        # Output is always the step's internal name + iterate-on
+        if composite_node.node_type == "map":
+            output_parameter = OutputParameter(name="iterate-on")
+            outputs.append(output_parameter)
+        # Create the node now
+        step_config = {"command": command, "type": "task", "next": "dummy"}
+        node = create_node(name=f"{clean_name}-fan-out", step_config=step_config)
+        container_template = self.create_container_template(
+            working_on=node,
+            command=command,
+            outputs=outputs,
+            inputs=inputs,
+            overwrite_name=f"{clean_name}-fan-out",
+        )
+        self._container_templates.append(container_template)
+        return DagTaskTemplate(
+            name=f"{clean_name}-fan-out", template=f"{clean_name}-fan-out"
+        )
+    def _create_fan_in_template(
+        self, composite_node, list_of_iter_values: Optional[List] = None
+    ):
+        clean_name = self.get_clean_name(composite_node)
+        inputs = []
+        # If we are fanning in already map state, we need to send the map variable inside
+        # The container template also should be accepting an input parameter
+        map_variable = None
+        if list_of_iter_values:
+            map_variable = self.compose_map_variable(
+                list_of_iter_values=list_of_iter_values
+            )
+            for val in list_of_iter_values:
+                inputs.append(Parameter(name=val))
+        command = utils.get_fan_command(
+            mode="in",
+            node=composite_node,
+            run_id=self._run_id_placeholder,
+            map_variable=map_variable,
+            log_level=self._log_level,
+        )
+        step_config = {"command": command, "type": "task", "next": "dummy"}
+        node = create_node(name=f"{clean_name}-fan-in", step_config=step_config)
+        container_template = self.create_container_template(
+            working_on=node,
+            command=command,
+            inputs=inputs,
+            overwrite_name=f"{clean_name}-fan-in",
+        )
+        self._container_templates.append(container_template)
+        clean_name = self.get_clean_name(composite_node)
+        return DagTaskTemplate(
+            name=f"{clean_name}-fan-in", template=f"{clean_name}-fan-in"
+        )
+    def _gather_task_templates_of_dag(
+        self,
+        dag: Graph,
+        dag_name="runnable-dag",
+        list_of_iter_values: Optional[List] = None,
+    ):
+        current_node = dag.start_at
+        previous_node = None
+        previous_node_template_name = None
+        templates: Dict[str, DagTaskTemplate] = {}
+        if not list_of_iter_values:
+            list_of_iter_values = []
+        while True:
+            working_on = dag.get_node_by_name(current_node)
+            if previous_node == current_node:
+                raise Exception("Potentially running in a infinite loop")
+            render_obj = get_renderer(working_on)(executor=self, node=working_on)
+            render_obj.render(list_of_iter_values=list_of_iter_values.copy())
+            clean_name = self.get_clean_name(working_on)
+            # If a task template for clean name exists, retrieve it (could have been created by on_failure)
+            template = templates.get(
+                clean_name, DagTaskTemplate(name=clean_name, template=clean_name)
+            )
+            # Link the current node to previous node, if the previous node was successful.
+            if previous_node:
+                template.depends.append(f"{previous_node_template_name}.Succeeded")
+            templates[clean_name] = template
+            # On failure nodes
+            if (
+                working_on.node_type not in ["success", "fail"]
+                and working_on._get_on_failure_node()
+            ):
+                failure_node = dag.get_node_by_name(working_on._get_on_failure_node())
+                # same logic, if a template exists, retrieve it
+                # if not, create a new one
+                render_obj = get_renderer(working_on)(executor=self, node=failure_node)
+                render_obj.render(list_of_iter_values=list_of_iter_values.copy())
+                failure_template_name = self.get_clean_name(failure_node)
+                # If a task template for clean name exists, retrieve it
+                failure_template = templates.get(
+                    failure_template_name,
+                    DagTaskTemplate(
+                        name=failure_template_name, template=failure_template_name
+                    ),
+                )
+                failure_template.depends.append(f"{clean_name}.Failed")
+                templates[failure_template_name] = failure_template
+            # If we are in a map node, we need to add the values as arguments
+            template = templates[clean_name]
+            if list_of_iter_values:
+                if not template.arguments:
+                    template.arguments = []
+                for value in list_of_iter_values:
+                    template.arguments.append(
+                        Argument(
+                            name=value, value="{{inputs.parameters." + value + "}}"
+                        )
+                    )
+            # Move ahead to the next node
+            previous_node = current_node
+            previous_node_template_name = self.get_clean_name(working_on)
+            if working_on.node_type in ["success", "fail"]:
+                break
+            current_node = working_on._get_next_node()
+        # Add the iteration values as input to dag template
+        dag_template = DagTemplate(tasks=list(templates.values()), name=dag_name)
+        if list_of_iter_values:
+            if not dag_template.inputs:
+                dag_template.inputs = []
+            dag_template.inputs.extend(
+                [Parameter(name=val) for val in list_of_iter_values]
+            )
+        # Add the dag template to the list of templates
+        self._dag_templates.append(dag_template)
+    def _get_template_defaults(self) -> TemplateDefaults:
+        user_provided_config = self.model_dump(by_alias=False)
+        return TemplateDefaults(**user_provided_config)
+    def execute_graph(self, dag: Graph, map_variable: Optional[dict] = None, **kwargs):
+        # TODO: Add metadata
+        arguments = []
+        # Expose "simple" parameters as workflow arguments for dynamic behavior
+        if self.expose_parameters_as_inputs:
+            for key, value in self._get_parameters().items():
+                value = value.get_value()  # type: ignore
+                if isinstance(value, dict) or isinstance(value, list):
+                    continue
+                env_var = EnvVar(name=key, value=value)  # type: ignore
+                arguments.append(env_var)
+        run_id_var = EnvVar(name="run_id", value="{{workflow.uid}}")
+        log_level_var = EnvVar(name="log_level", value=defaults.LOG_LEVEL)
+        arguments.append(run_id_var)
+        arguments.append(log_level_var)
+        # TODO: Can we do reruns?
+        for volume in self.spec.volumes:
+            self._container_volumes.append(
+                ContainerVolume(name=volume.name, mount_path=volume.mount_path)
+            )
+        # Container specifications are globally collected and added at the end.
+        # Dag specifications are added as part of the dag traversal.
+        templates: List[Union[DagTemplate, ContainerTemplate]] = []
+        self._gather_task_templates_of_dag(dag=dag, list_of_iter_values=[])
+        templates.extend(self._dag_templates)
+        templates.extend(self._container_templates)
+        spec = self.spec
+        spec.templates = templates
+        spec.arguments = arguments
+        workflow = Workflow(metadata=self.metadata, spec=spec)
+        yaml = YAML()
+        with open(self.output_file, "w") as f:
+            yaml.indent(mapping=2, sequence=4, offset=2)
+            yaml.dump(workflow.model_dump(by_alias=True, exclude_none=True), f)
+    def send_return_code(self, stage="traversal"):
+        """
+        Convenience function used by pipeline to send return code to the caller of the cli
+        Raises:
+            Exception: If the pipeline execution failed
+        """
+        if (
+            stage != "traversal"
+        ):  # traversal does no actual execution, so return code is pointless
+            run_id = self._context.run_id
+            run_log = self._context.run_log_store.get_run_log_by_id(
+                run_id=run_id, full=False
+            )
+            if run_log.status == defaults.FAIL:
+                raise exceptions.ExecutionFailedError(run_id)
+# TODO:
+# class FileSystemRunLogStore(BaseIntegration):
+#     """
+#     Only local execution mode is possible for Buffered Run Log store
+#     """
+#     executor_type = "argo"
+#     service_type = "run_log_store"  # One of secret, catalog, datastore
+#     service_provider = "file-system"  # The actual implementation of the service
+#     def validate(self, **kwargs):
+#         msg = (
+#             "Argo cannot run work with file-system run log store. "
+#             "Unless you have made a mechanism to use volume mounts."
+#             "Using this run log store if the pipeline has concurrent tasks might lead to unexpected results"
+#         )
+#         logger.warning(msg)
+# class ChunkedFileSystemRunLogStore(BaseIntegration):
+#     """
+#     Only local execution mode is possible for Buffered Run Log store
+#     """
+#     executor_type = "argo"
+#     service_type = "run_log_store"  # One of secret, catalog, datastore
+#     service_provider = "chunked-fs"  # The actual implementation of the service
+#     def validate(self, **kwargs):
+#         msg = (
+#             "Argo cannot run work with chunked file-system run log store. "
+#             "Unless you have made a mechanism to use volume mounts"
+#         )
+#         logger.warning(msg)
+# class FileSystemCatalog(BaseIntegration):
+#     """
+#     Only local execution mode is possible for Buffered Run Log store
+#     """
+#     executor_type = "argo"
+#     service_type = "catalog"  # One of secret, catalog, datastore
+#     service_provider = "file-system"  # The actual implementation of the service
+#     def validate(self, **kwargs):
+#         msg = "Argo cannot run work with file-system run log store. Unless you have made a mechanism to use volume mounts"
+#         logger.warning(msg)

runnable 0.17.1__py3-none-any.whl → 0.19.0__py3-none-any.whl

runnable 0.17.1py3-none-any.whl → 0.19.0py3-none-any.whl