PyPI - polyaxon - Versions diffs - 2.0.0rc49__py3-none-any.whl → 2.4.0rc1__py3-none-any.whl - Mend

polyaxon 2.0.0rc49py3-none-any.whl → 2.4.0rc1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (177) hide show

polyaxon/_auxiliaries/cleaner.py +8 -3
polyaxon/_auxiliaries/init.py +7 -2
polyaxon/_auxiliaries/notifier.py +8 -2
polyaxon/_auxiliaries/sidecar.py +30 -2
polyaxon/_cli/artifacts.py +96 -11
polyaxon/_cli/components.py +96 -11
polyaxon/_cli/config.py +118 -22
polyaxon/_cli/dashboard.py +15 -2
polyaxon/_cli/init.py +1 -1
polyaxon/_cli/models.py +96 -11
polyaxon/_cli/operations.py +267 -90
polyaxon/_cli/project_versions.py +139 -6
polyaxon/_cli/projects.py +23 -9
polyaxon/_cli/run.py +37 -9
polyaxon/_cli/services/agent.py +2 -2
polyaxon/_cli/services/clean_artifacts.py +1 -1
polyaxon/_cli/services/sidecar.py +8 -1
polyaxon/_client/client.py +17 -0
polyaxon/_client/mixin.py +39 -0
polyaxon/_client/project.py +218 -23
polyaxon/_client/run.py +131 -33
polyaxon/_compiler/contexts/contexts.py +2 -2
polyaxon/_compiler/contexts/ray_job.py +4 -2
polyaxon/_compiler/resolver/agent.py +12 -2
polyaxon/_compiler/resolver/runtime.py +2 -2
polyaxon/_contexts/paths.py +4 -7
polyaxon/_deploy/operators/compose.py +1 -27
polyaxon/_deploy/schemas/deployment.py +4 -1
polyaxon/_deploy/schemas/intervals.py +0 -7
polyaxon/_deploy/schemas/proxy.py +1 -0
polyaxon/_deploy/schemas/service.py +11 -1
polyaxon/_docker/converter/base/base.py +8 -0
polyaxon/_docker/executor.py +10 -4
polyaxon/_env_vars/getters/owner_entity.py +4 -2
polyaxon/_env_vars/getters/project.py +4 -2
polyaxon/_env_vars/getters/run.py +5 -2
polyaxon/_env_vars/keys.py +7 -1
polyaxon/_flow/__init__.py +2 -0
polyaxon/_flow/builds/__init__.py +19 -6
polyaxon/_flow/component/base.py +1 -0
polyaxon/_flow/component/component.py +14 -0
polyaxon/_flow/environment/__init__.py +8 -8
polyaxon/_flow/hooks/__init__.py +19 -6
polyaxon/_flow/init/__init__.py +6 -6
polyaxon/_flow/matrix/iterative.py +0 -1
polyaxon/_flow/matrix/tuner.py +18 -6
polyaxon/_flow/operations/operation.py +44 -17
polyaxon/_flow/plugins/__init__.py +6 -0
polyaxon/_flow/run/__init__.py +2 -2
polyaxon/_flow/run/dag.py +2 -2
polyaxon/_flow/run/dask/dask.py +0 -1
polyaxon/_flow/run/dask/replica.py +3 -3
polyaxon/_flow/run/enums.py +5 -0
polyaxon/_flow/run/job.py +4 -4
polyaxon/_flow/run/kubeflow/mpi_job.py +1 -2
polyaxon/_flow/run/kubeflow/mx_job.py +1 -2
polyaxon/_flow/run/kubeflow/paddle_job.py +35 -4
polyaxon/_flow/run/kubeflow/pytorch_job.py +51 -5
polyaxon/_flow/run/kubeflow/replica.py +4 -4
polyaxon/_flow/run/kubeflow/scheduling_policy.py +12 -0
polyaxon/_flow/run/kubeflow/tf_job.py +3 -3
polyaxon/_flow/run/kubeflow/xgboost_job.py +1 -2
polyaxon/_flow/run/ray/ray.py +2 -3
polyaxon/_flow/run/ray/replica.py +3 -3
polyaxon/_flow/run/service.py +4 -4
polyaxon/_fs/fs.py +7 -2
polyaxon/_fs/utils.py +3 -2
polyaxon/_k8s/converter/base/base.py +2 -1
polyaxon/_k8s/converter/base/main.py +1 -0
polyaxon/_k8s/converter/base/sidecar.py +16 -1
polyaxon/_k8s/converter/common/accelerators.py +7 -4
polyaxon/_k8s/converter/converters/job.py +1 -1
polyaxon/_k8s/converter/converters/kubeflow/paddle_job.py +1 -0
polyaxon/_k8s/converter/converters/kubeflow/pytroch_job.py +2 -0
polyaxon/_k8s/converter/converters/kubeflow/tf_job.py +1 -0
polyaxon/_k8s/converter/converters/ray_job.py +4 -2
polyaxon/_k8s/custom_resources/dask_job.py +3 -0
polyaxon/_k8s/custom_resources/kubeflow/common.py +4 -1
polyaxon/_k8s/custom_resources/kubeflow/paddle_job.py +10 -1
polyaxon/_k8s/custom_resources/kubeflow/pytorch_job.py +14 -1
polyaxon/_k8s/custom_resources/kubeflow/tf_job.py +4 -0
polyaxon/_k8s/custom_resources/ray_job.py +3 -0
polyaxon/_k8s/custom_resources/setter.py +1 -1
polyaxon/_k8s/executor/async_executor.py +2 -0
polyaxon/_k8s/executor/base.py +23 -6
polyaxon/_k8s/logging/async_monitor.py +150 -5
polyaxon/_k8s/manager/async_manager.py +96 -23
polyaxon/_k8s/manager/base.py +4 -0
polyaxon/_k8s/manager/manager.py +282 -134
polyaxon/_local_process/__init__.py +0 -0
polyaxon/_local_process/agent.py +6 -0
polyaxon/_local_process/converter/__init__.py +1 -0
polyaxon/_local_process/converter/base/__init__.py +1 -0
polyaxon/_local_process/converter/base/base.py +140 -0
polyaxon/_local_process/converter/base/containers.py +69 -0
polyaxon/_local_process/converter/base/env_vars.py +253 -0
polyaxon/_local_process/converter/base/init.py +414 -0
polyaxon/_local_process/converter/base/main.py +74 -0
polyaxon/_local_process/converter/base/mounts.py +82 -0
polyaxon/_local_process/converter/converters/__init__.py +8 -0
polyaxon/_local_process/converter/converters/job.py +40 -0
polyaxon/_local_process/converter/converters/service.py +41 -0
polyaxon/_local_process/converter/mixins.py +38 -0
polyaxon/_local_process/executor.py +132 -0
polyaxon/_local_process/process_types.py +39 -0
polyaxon/_managers/agent.py +2 -0
polyaxon/_managers/home.py +2 -1
polyaxon/_operations/tuner.py +1 -0
polyaxon/_polyaxonfile/check.py +2 -0
polyaxon/_polyaxonfile/manager/operations.py +3 -0
polyaxon/_polyaxonfile/manager/workflows.py +2 -0
polyaxon/_polyaxonfile/specs/compiled_operation.py +1 -0
polyaxon/_polyaxonfile/specs/operation.py +1 -0
polyaxon/_polyaxonfile/specs/sections.py +3 -0
polyaxon/_pql/manager.py +1 -1
polyaxon/_runner/agent/async_agent.py +97 -21
polyaxon/_runner/agent/base_agent.py +27 -9
polyaxon/_runner/agent/client.py +15 -1
polyaxon/_runner/agent/sync_agent.py +85 -20
polyaxon/_runner/converter/converter.py +6 -2
polyaxon/_runner/executor.py +13 -7
polyaxon/_schemas/agent.py +27 -1
polyaxon/_schemas/client.py +30 -3
polyaxon/_schemas/installation.py +4 -3
polyaxon/_schemas/lifecycle.py +10 -5
polyaxon/_schemas/log_handler.py +2 -3
polyaxon/_schemas/types/artifacts.py +3 -3
polyaxon/_schemas/types/dockerfile.py +3 -3
polyaxon/_schemas/types/file.py +3 -3
polyaxon/_schemas/types/git.py +3 -3
polyaxon/_schemas/types/tensorboard.py +3 -3
polyaxon/_sdk/api/agents_v1_api.py +1076 -73
polyaxon/_sdk/api/organizations_v1_api.py +371 -10
polyaxon/_sdk/api/project_dashboards_v1_api.py +12 -12
polyaxon/_sdk/api/project_searches_v1_api.py +12 -12
polyaxon/_sdk/api/projects_v1_api.py +221 -44
polyaxon/_sdk/api/runs_v1_api.py +917 -445
polyaxon/_sdk/api/service_accounts_v1_api.py +16 -16
polyaxon/_sdk/api/teams_v1_api.py +2827 -375
polyaxon/_sdk/api/users_v1_api.py +231 -55
polyaxon/_sdk/async_client/api_client.py +4 -0
polyaxon/_sdk/schemas/__init__.py +10 -2
polyaxon/_sdk/schemas/v1_agent.py +2 -1
polyaxon/_sdk/schemas/v1_agent_reconcile_body_request.py +14 -0
polyaxon/_sdk/schemas/v1_artifact_tree.py +1 -1
polyaxon/_sdk/schemas/v1_dashboard_spec.py +4 -0
polyaxon/_sdk/schemas/v1_events_response.py +4 -0
polyaxon/_sdk/schemas/v1_organization.py +1 -0
polyaxon/_sdk/schemas/v1_preset.py +8 -0
polyaxon/_sdk/schemas/v1_project.py +1 -0
polyaxon/_sdk/schemas/v1_project_settings.py +4 -2
polyaxon/_sdk/schemas/v1_run.py +2 -2
polyaxon/_sdk/schemas/v1_run_edge_lineage.py +14 -0
polyaxon/_sdk/schemas/v1_run_edges_graph.py +9 -0
polyaxon/_sdk/schemas/v1_section_spec.py +7 -2
polyaxon/_sdk/schemas/v1_settings_catalog.py +1 -0
polyaxon/_sdk/schemas/v1_team.py +3 -0
polyaxon/_sdk/schemas/v1_user.py +1 -2
polyaxon/_sdk/schemas/v1_user_access.py +17 -0
polyaxon/_services/values.py +1 -0
polyaxon/_sidecar/container/__init__.py +39 -18
polyaxon/_sidecar/container/monitors/__init__.py +1 -0
polyaxon/_sidecar/container/monitors/logs.py +10 -13
polyaxon/_sidecar/container/monitors/spec.py +24 -0
polyaxon/_sidecar/ignore.py +0 -1
polyaxon/_utils/fqn_utils.py +25 -2
polyaxon/client.py +1 -1
polyaxon/pkg.py +1 -1
polyaxon/schemas.py +8 -1
polyaxon/settings.py +6 -0
{polyaxon-2.0.0rc49.dist-info → polyaxon-2.4.0rc1.dist-info}/METADATA +43 -43
{polyaxon-2.0.0rc49.dist-info → polyaxon-2.4.0rc1.dist-info}/RECORD +176 -155
{polyaxon-2.0.0rc49.dist-info → polyaxon-2.4.0rc1.dist-info}/WHEEL +1 -1
polyaxon/_sdk/schemas/v1_project_user_access.py +0 -10
{polyaxon-2.0.0rc49.dist-info → polyaxon-2.4.0rc1.dist-info}/LICENSE +0 -0
{polyaxon-2.0.0rc49.dist-info → polyaxon-2.4.0rc1.dist-info}/entry_points.txt +0 -0
{polyaxon-2.0.0rc49.dist-info → polyaxon-2.4.0rc1.dist-info}/top_level.txt +0 -0

polyaxon/_k8s/converter/base/sidecar.py CHANGED Viewed

@@ -33,15 +33,26 @@ class SidecarConverter(_BaseConverter):
     @staticmethod
     def _get_sidecar_args(
-        container_id: str, sleep_interval: int, sync_interval: int, monitor_logs: bool
+        container_id: str,
+        sleep_interval: int,
+        sync_interval: int,
+        monitor_logs: bool,
+        monitor_spec: bool,
     ) -> List[str]:
         args = [
             "--container-id={}".format(container_id),
             "--sleep-interval={}".format(sleep_interval),
             "--sync-interval={}".format(sync_interval),
         ]
+        # enable monitor logs and spec by default
+        if monitor_logs is None:
+            monitor_logs = True
+        if monitor_spec is None:
+            monitor_spec = True
         if monitor_logs:
             args.append("--monitor-logs")
+        if monitor_spec:
+            args.append("--monitor-spec")
         return args
     @classmethod
@@ -87,6 +98,7 @@ class SidecarConverter(_BaseConverter):
         sleep_interval = polyaxon_sidecar.sleep_interval
         sync_interval = polyaxon_sidecar.sync_interval
         monitor_logs = polyaxon_sidecar.monitor_logs
+        monitor_spec = polyaxon_sidecar.monitor_spec
         if plugins and plugins.sidecar:
             if plugins.sidecar.sleep_interval:
                 sleep_interval = plugins.sidecar.sleep_interval
@@ -94,11 +106,14 @@ class SidecarConverter(_BaseConverter):
                 sync_interval = plugins.sidecar.sync_interval
             if plugins.sidecar.monitor_logs:
                 monitor_logs = plugins.sidecar.monitor_logs
+            if plugins.sidecar.monitor_spec:
+                monitor_spec = plugins.sidecar.monitor_spec
         sidecar_args = cls._get_sidecar_args(
             container_id=container_id,
             sleep_interval=sleep_interval,
             sync_interval=sync_interval,
             monitor_logs=monitor_logs,
+            monitor_spec=monitor_spec,
         )
         env_from = []

polyaxon/_k8s/converter/common/accelerators.py CHANGED Viewed

@@ -37,14 +37,17 @@ def requests_gpu(resources: k8s_schemas.V1ResourceRequirements) -> bool:
     if not resources:
         return False
+    if not isinstance(resources, k8s_schemas.V1ResourceRequirements):
+        resources = k8s_schemas.V1ResourceRequirements(**resources)
     if resources.requests:
-        for key in resources.requests.keys():
-            if "gpu" in key:
+        for key, val in resources.requests.items():
+            if "gpu" in key and val is not None and val > 0:
                 return True
     if resources.limits:
-        for key in resources.limits.keys():
-            if "gpu" in key:
+        for key, val in resources.limits.items():
+            if "gpu" in key and val is not None and val > 0:
                 return True
     return False

polyaxon/_k8s/converter/converters/job.py CHANGED Viewed

@@ -39,7 +39,7 @@ class JobConverter(JobMixin, BaseConverter):
             default_sa=default_sa,
         )
         return get_job_custom_resource(
-            namespace=self.namespace,
+            namespace=compiled_operation.namespace or self.namespace,
             main_container=replica_spec.main_container,
             sidecar_containers=replica_spec.sidecar_containers,
             init_containers=replica_spec.init_containers,

polyaxon/_k8s/converter/converters/kubeflow/paddle_job.py CHANGED Viewed

@@ -58,6 +58,7 @@ class PaddleJobConverter(PaddleJobMixin, BaseConverter):
             termination=compiled_operation.termination,
             clean_pod_policy=job.clean_pod_policy,
             scheduling_policy=job.scheduling_policy,
+            elastic_policy=job.elastic_policy,
             collect_logs=plugins.collect_logs,
             sync_statuses=plugins.sync_statuses,
             notifications=plugins.notifications,

polyaxon/_k8s/converter/converters/kubeflow/pytroch_job.py CHANGED Viewed

@@ -58,6 +58,8 @@ class PytorchJobConverter(PytorchJobMixin, BaseConverter):
             termination=compiled_operation.termination,
             clean_pod_policy=job.clean_pod_policy,
             scheduling_policy=job.scheduling_policy,
+            elastic_policy=job.elastic_policy,
+            n_proc_per_node=job.n_proc_per_node,
             collect_logs=plugins.collect_logs,
             sync_statuses=plugins.sync_statuses,
             notifications=plugins.notifications,

polyaxon/_k8s/converter/converters/kubeflow/tf_job.py CHANGED Viewed

@@ -63,6 +63,7 @@ class TfJobConverter(TFJobMixin, BaseConverter):
             collect_logs=plugins.collect_logs,
             clean_pod_policy=job.clean_pod_policy,
             scheduling_policy=job.scheduling_policy,
+            success_policy=job.success_policy,
             enable_dynamic_worker=job.enable_dynamic_worker,
             sync_statuses=plugins.sync_statuses,
             notifications=plugins.notifications,

polyaxon/_k8s/converter/converters/ray_job.py CHANGED Viewed

@@ -58,7 +58,9 @@ class RayJobConverter(RayJobMixin, BaseConverter):
             config=compiled_operation.plugins, auth=default_auth
         )
         head = _get_replica(job.head)
-        workers = {n: _get_replica(w) for n, w in job.workers.items()}
+        workers = None
+        if job.workers:
+            workers = {n: _get_replica(w) for n, w in job.workers.items()}
         labels = self.get_labels(version=pkg.VERSION, labels={})
         return get_ray_job_custom_resource(
@@ -68,7 +70,7 @@ class RayJobConverter(RayJobMixin, BaseConverter):
             workers=workers,
             entrypoint=job.entrypoint,
             metadata=job.metadata,
-            runtime_env=encode(orjson_dumps(job.runtime_env)),
+            runtime_env=orjson_dumps(job.runtime_env),
             ray_version=job.ray_version,
             termination=compiled_operation.termination,
             collect_logs=plugins.collect_logs,

polyaxon/_k8s/custom_resources/dask_job.py CHANGED Viewed

@@ -46,6 +46,9 @@ def get_dask_replicas_template(
     if liveness_probe and replica.main_container.liveness_probe is None:
         replica.main_container.liveness_probe = liveness_probe
+    labels = {**labels, **replica.labels}
+    annotations = {**annotations, **replica.annotations}
     metadata, pod_spec = get_pod_spec(
         namespace=namespace,
         main_container=replica.main_container,

polyaxon/_k8s/custom_resources/kubeflow/common.py CHANGED Viewed

@@ -16,6 +16,9 @@ def get_kf_replicas_template(
     if not replica:
         return
+    labels = {**labels, **replica.labels}
+    annotations = {**annotations, **replica.annotations}
     metadata, pod_spec = get_pod_spec(
         namespace=namespace,
         main_container=replica.main_container,
@@ -30,6 +33,6 @@ def get_kf_replicas_template(
     template_spec[replica_name] = {
         "replicas": replica.num_replicas,
-        "restartPolicy": pod_spec.restart_policy or "Never",
+        "restartPolicy": pod_spec.restart_policy or "OnFailure",
         "template": get_pod_template_spec(metadata=metadata, pod_spec=pod_spec),
     }

polyaxon/_k8s/custom_resources/kubeflow/paddle_job.py CHANGED Viewed

@@ -1,6 +1,11 @@
 from typing import Dict, List, Optional
-from polyaxon._flow import V1Notification, V1SchedulingPolicy, V1Termination
+from polyaxon._flow import (
+    V1Notification,
+    V1PaddleElasticPolicy,
+    V1SchedulingPolicy,
+    V1Termination,
+)
 from polyaxon._k8s.custom_resources.kubeflow.common import get_kf_replicas_template
 from polyaxon._k8s.custom_resources.operation import get_operation_custom_object
 from polyaxon._k8s.custom_resources.setter import (
@@ -25,6 +30,7 @@ def get_paddle_job_custom_resource(
     notifications: List[V1Notification],
     clean_pod_policy: Optional[str],
     scheduling_policy: Optional[V1SchedulingPolicy],
+    elastic_policy: Optional[V1PaddleElasticPolicy],
     labels: Dict[str, str],
     annotations: Dict[str, str],
 ) -> Dict:
@@ -58,6 +64,9 @@ def get_paddle_job_custom_resource(
         template_spec=template_spec, scheduling_policy=scheduling_policy
     )
+    if elastic_policy:
+        template_spec["elasticPolicy"] = elastic_policy.to_light_dict()
     custom_object = {"paddleJobSpec": template_spec}
     custom_object = set_termination(
         custom_object=custom_object, termination=termination

polyaxon/_k8s/custom_resources/kubeflow/pytorch_job.py CHANGED Viewed

@@ -1,6 +1,11 @@
 from typing import Dict, List, Optional
-from polyaxon._flow import V1Notification, V1SchedulingPolicy, V1Termination
+from polyaxon._flow import (
+    V1Notification,
+    V1PytorchElasticPolicy,
+    V1SchedulingPolicy,
+    V1Termination,
+)
 from polyaxon._k8s.custom_resources.kubeflow.common import get_kf_replicas_template
 from polyaxon._k8s.custom_resources.operation import get_operation_custom_object
 from polyaxon._k8s.custom_resources.setter import (
@@ -25,6 +30,8 @@ def get_pytorch_job_custom_resource(
     notifications: List[V1Notification],
     clean_pod_policy: Optional[str],
     scheduling_policy: Optional[V1SchedulingPolicy],
+    elastic_policy: Optional[V1PytorchElasticPolicy],
+    n_proc_per_node: Optional[int],
     labels: Dict[str, str],
     annotations: Dict[str, str],
 ) -> Dict:
@@ -58,6 +65,12 @@ def get_pytorch_job_custom_resource(
         template_spec=template_spec, scheduling_policy=scheduling_policy
     )
+    if elastic_policy:
+        template_spec["elasticPolicy"] = elastic_policy.to_light_dict()
+    if n_proc_per_node is not None:
+        template_spec["nProcPerNode"] = str(n_proc_per_node)
     custom_object = {"pytorchJobSpec": template_spec}
     custom_object = set_termination(
         custom_object=custom_object, termination=termination

polyaxon/_k8s/custom_resources/kubeflow/tf_job.py CHANGED Viewed

@@ -28,6 +28,7 @@ def get_tf_job_custom_resource(
     clean_pod_policy: Optional[str],
     scheduling_policy: Optional[V1SchedulingPolicy],
     enable_dynamic_worker: bool,
+    success_policy: Optional[str],
     labels: Dict[str, str],
     annotations: Dict[str, str],
 ) -> Dict:
@@ -73,6 +74,9 @@ def get_tf_job_custom_resource(
     if enable_dynamic_worker:
         template_spec["enableDynamicWorker"] = enable_dynamic_worker
+    if success_policy:
+        template_spec["successPolicy"] = success_policy
     template_spec = {"replicaSpecs": template_spec}
     template_spec = set_clean_pod_policy(

polyaxon/_k8s/custom_resources/ray_job.py CHANGED Viewed

@@ -26,6 +26,9 @@ def _get_ray_replicas_template(
     if not replica:
         return
+    labels = {**labels, **replica.labels}
+    annotations = {**annotations, **replica.annotations}
     metadata, pod_spec = get_pod_spec(
         namespace=namespace,
         main_container=replica.main_container,

polyaxon/_k8s/custom_resources/setter.py CHANGED Viewed

@@ -46,7 +46,7 @@ def set_notify(custom_object: Dict, notifications: List[V1Notification]) -> Dict
 def set_clean_pod_policy(template_spec: Dict, clean_pod_policy: str) -> Dict:
     if not clean_pod_policy:
         # Sets default clean pod policy
-        clean_pod_policy = "All"
+        clean_pod_policy = "None"
     template_spec["cleanPodPolicy"] = clean_pod_policy.capitalize()
     return template_spec

polyaxon/_k8s/executor/async_executor.py CHANGED Viewed

@@ -14,6 +14,8 @@ class AsyncExecutor(BaseExecutor):
         )
     async def refresh(self):
+        if self._manager:
+            await self._manager.close()
         manager = super().refresh()
         await manager.setup()
         return manager

polyaxon/_k8s/executor/base.py CHANGED Viewed

@@ -5,7 +5,7 @@ from kubernetes.client import Configuration
 from polyaxon import settings
 from polyaxon._k8s.converter.converters import CONVERTERS
-from polyaxon._k8s.converter.mixins import MIXIN_MAPPING
+from polyaxon._k8s.converter.mixins import MIXIN_MAPPING, BaseMixin
 from polyaxon._runner.executor import BaseExecutor as _BaseExecutor
 from polyaxon._runner.kinds import RunnerKind
 from polyaxon._utils.fqn_utils import get_resource_name
@@ -56,7 +56,9 @@ class BaseExecutor(_BaseExecutor):
         api = k8s_client.ApiClient()
         return api.sanitize_for_serialization(resource)
-    def create(self, run_uuid: str, run_kind: str, resource: Dict) -> Dict:
+    def create(
+        self, run_uuid: str, run_kind: str, resource: Dict, namespace: str = None
+    ) -> Dict:
         mixin = self._get_mixin_for_kind(kind=run_kind)
         resource_name = get_resource_name(run_uuid)
         return self.manager.create_custom_object(
@@ -65,9 +67,12 @@ class BaseExecutor(_BaseExecutor):
             version=mixin.API_VERSION,
             plural=mixin.PLURAL,
             body=resource,
+            namespace=namespace,
         )
-    def apply(self, run_uuid: str, run_kind: str, resource: Dict) -> Dict:
+    def apply(
+        self, run_uuid: str, run_kind: str, resource: Dict, namespace: str = None
+    ) -> Dict:
         mixin = self._get_mixin_for_kind(kind=run_kind)
         resource_name = get_resource_name(run_uuid)
         return self.manager.update_custom_object(
@@ -76,9 +81,10 @@ class BaseExecutor(_BaseExecutor):
             version=mixin.API_VERSION,
             plural=mixin.PLURAL,
             body=resource,
+            namespace=namespace,
         )
-    def stop(self, run_uuid: str, run_kind: str):
+    def stop(self, run_uuid: str, run_kind: str, namespace: str = None):
         mixin = self._get_mixin_for_kind(kind=run_kind)
         resource_name = get_resource_name(run_uuid)
         return self.manager.delete_custom_object(
@@ -86,16 +92,18 @@ class BaseExecutor(_BaseExecutor):
             group=mixin.GROUP,
             version=mixin.API_VERSION,
             plural=mixin.PLURAL,
+            namespace=namespace,
         )
-    def clean(self, run_uuid: str, run_kind: str):
+    def clean(self, run_uuid: str, run_kind: str, namespace: str = None):
         return self.apply(
             run_uuid=run_uuid,
             run_kind=run_kind,
             resource={"metadata": {"finalizers": None}},
+            namespace=namespace,
         )
-    def get(self, run_uuid: str, run_kind: str):
+    def get(self, run_uuid: str, run_kind: str, namespace: str = None):
         mixin = self._get_mixin_for_kind(kind=run_kind)
         resource_name = get_resource_name(run_uuid)
         return self.manager.get_custom_object(
@@ -103,4 +111,13 @@ class BaseExecutor(_BaseExecutor):
             group=mixin.GROUP,
             version=mixin.API_VERSION,
             plural=mixin.PLURAL,
+            namespace=namespace,
+        )
+    def list_ops(self, namespace: str = None):
+        return self.manager.list_custom_objects(
+            group=BaseMixin.GROUP,
+            version=BaseMixin.API_VERSION,
+            plural=BaseMixin.PLURAL,
+            namespace=namespace,
         )

polyaxon/_k8s/logging/async_monitor.py CHANGED Viewed

@@ -6,6 +6,7 @@ from clipped.utils.tz import now
 from kubernetes_asyncio.client.models import V1Pod
 from kubernetes_asyncio.client.rest import ApiException
+from polyaxon._flow import V1RunKind
 from polyaxon._k8s.manager.async_manager import AsyncK8sManager
 from traceml.logging import V1Log, V1Logs
@@ -65,7 +66,7 @@ async def query_k8s_operation_logs(
     new_time = now()
     params = {}
     if last_time:
-        since_seconds = (new_time - last_time).total_seconds() - 1
+        since_seconds = (new_time - last_time).total_seconds()
         params["since_seconds"] = int(since_seconds)
     if stream:
         params["tail_lines"] = V1Logs._CHUNK_SIZE
@@ -82,9 +83,28 @@ async def query_k8s_operation_logs(
             **params,
         )
+    if logs and last_time:
+        # make sure to filter logs larger than last_time
+        logs = [log for log in logs if log.timestamp > last_time]
+    if logs and logs[-1].timestamp:
+        new_time = logs[-1].timestamp
     return logs, new_time
+async def collect_agent_service_logs(
+    k8s_manager: AsyncK8sManager, pod: V1Pod
+) -> List[V1Log]:
+    if not pod or not pod.spec.containers:
+        return []
+    container = pod.spec.containers[0]
+    return await handle_container_logs(
+        k8s_manager=k8s_manager,
+        pod=pod,
+        container_name=container.name,
+        tail_lines=V1Logs._CHUNK_SIZE,
+    )
 async def query_k8s_pod_logs(
     k8s_manager: AsyncK8sManager,
     pod: V1Pod,
@@ -94,13 +114,138 @@ async def query_k8s_pod_logs(
     new_time = now()
     params = {}
     if last_time:
-        since_seconds = (new_time - last_time).total_seconds() - 1
+        since_seconds = (new_time - last_time).total_seconds()
         params["since_seconds"] = int(since_seconds)
     if stream:
         params["tail_lines"] = V1Logs._CHUNK_SIZE
     logs = await handle_pod_logs(k8s_manager=k8s_manager, pod=pod, **params)
-    if logs:
-        last_time = logs[-1].timestamp
-    return logs, last_time
+    if logs and last_time:
+        # make sure to filter logs larger than last_time
+        logs = [log for log in logs if log.timestamp > last_time]
+    if logs and logs[-1].timestamp:
+        new_time = logs[-1].timestamp
+    return logs, new_time
+async def get_op_pods_and_services(
+    k8s_manager: AsyncK8sManager,
+    run_uuid: str,
+    run_kind: str,
+):
+    pods = await k8s_manager.list_pods(
+        label_selector=k8s_manager.get_managed_by_polyaxon(run_uuid)
+    )
+    services = []
+    if V1RunKind.has_service(run_kind):
+        services = await k8s_manager.list_services(
+            label_selector=k8s_manager.get_managed_by_polyaxon(run_uuid)
+        )
+    return pods, services
+async def get_resource_events(
+    k8s_manager: AsyncK8sManager, resource_type: str, resource_name: str
+):
+    field_selector = (
+        f"involvedObject.kind={resource_type},involvedObject.name={resource_name}"
+    )
+    try:
+        events = await k8s_manager.list_namespaced_events(field_selector=field_selector)
+        all_events = []
+        for event in events:
+            event_data = {
+                "reason": event.reason,
+                "message": event.message,
+                "first_timestamp": event.first_timestamp,
+                "last_timestamp": event.last_timestamp,
+                "count": event.count,
+                "type": event.type,
+            }
+            all_events.append(event_data)
+        return all_events
+    except ApiException as e:
+        print(f"Exception when calling CoreV1Api->list_namespaced_event: {e}")
+        return []
+async def get_op_spec(
+    k8s_manager: AsyncK8sManager,
+    run_uuid: str,
+    run_kind: str,
+):
+    pods, services = await get_op_pods_and_services(
+        k8s_manager=k8s_manager,
+        run_uuid=run_uuid,
+        run_kind=run_kind,
+    )
+    pods_list = {}
+    for pod in pods or []:
+        pods_list[
+            pod.metadata.name
+        ] = k8s_manager.api_client.sanitize_for_serialization(pod)
+        pods_list[pod.metadata.name]["events"] = await get_resource_events(
+            k8s_manager=k8s_manager,
+            resource_type="Pod",
+            resource_name=pod.metadata.name,
+        )
+    services_list = {}
+    for service in services or []:
+        services_list[
+            service.metadata.name
+        ] = k8s_manager.api_client.sanitize_for_serialization(service)
+        services_list[service.metadata.name]["events"] = await get_resource_events(
+            k8s_manager=k8s_manager,
+            resource_type="Service",
+            resource_name=service.metadata.name,
+        )
+    data = {"pods": pods_list, "services": services_list}
+    return data, pods, services
+async def get_agent_pods_and_services(
+    k8s_manager: AsyncK8sManager,
+):
+    pods = await k8s_manager.list_pods(
+        label_selector=k8s_manager.get_core_polyaxon(),
+    )
+    services = await k8s_manager.list_services(
+        label_selector=k8s_manager.get_core_polyaxon(),
+    )
+    return pods, services
+async def get_agent_spec(
+    k8s_manager: AsyncK8sManager,
+):
+    pods, services = await get_agent_pods_and_services(
+        k8s_manager=k8s_manager,
+    )
+    pods_list = {}
+    for pod in pods or []:
+        pods_list[
+            pod.metadata.name
+        ] = k8s_manager.api_client.sanitize_for_serialization(pod)
+        pods_list[pod.metadata.name]["events"] = await get_resource_events(
+            k8s_manager=k8s_manager,
+            resource_type="Pod",
+            resource_name=pod.metadata.name,
+        )
+    data = {"pods": pods_list}
+    services_list = {}
+    for service in services or []:
+        services_list[
+            service.metadata.name
+        ] = k8s_manager.api_client.sanitize_for_serialization(service)
+        services_list[service.metadata.name]["events"] = await get_resource_events(
+            k8s_manager=k8s_manager,
+            resource_type="Service",
+            resource_name=service.metadata.name,
+        )
+    data["services"] = services_list
+    return data, pods, services

polyaxon 2.0.0rc49__py3-none-any.whl → 2.4.0rc1__py3-none-any.whl

polyaxon 2.0.0rc49py3-none-any.whl → 2.4.0rc1py3-none-any.whl