PyPI - fractal-server - Versions diffs - 1.4.6__py3-none-any.whl → 2.0.0__py3-none-any.whl - Mend

fractal-server 1.4.6py3-none-any.whl → 2.0.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (139) hide show

fractal_server/__init__.py +1 -1
fractal_server/app/db/__init__.py +0 -1
fractal_server/app/models/__init__.py +6 -8
fractal_server/app/models/linkuserproject.py +9 -0
fractal_server/app/models/security.py +6 -0
fractal_server/app/models/v1/__init__.py +12 -0
fractal_server/app/models/{dataset.py → v1/dataset.py} +5 -5
fractal_server/app/models/{job.py → v1/job.py} +5 -5
fractal_server/app/models/{project.py → v1/project.py} +5 -5
fractal_server/app/models/{state.py → v1/state.py} +2 -2
fractal_server/app/models/{task.py → v1/task.py} +7 -2
fractal_server/app/models/{workflow.py → v1/workflow.py} +5 -5
fractal_server/app/models/v2/__init__.py +22 -0
fractal_server/app/models/v2/collection_state.py +21 -0
fractal_server/app/models/v2/dataset.py +54 -0
fractal_server/app/models/v2/job.py +51 -0
fractal_server/app/models/v2/project.py +30 -0
fractal_server/app/models/v2/task.py +93 -0
fractal_server/app/models/v2/workflow.py +35 -0
fractal_server/app/models/v2/workflowtask.py +49 -0
fractal_server/app/routes/admin/__init__.py +0 -0
fractal_server/app/routes/{admin.py → admin/v1.py} +42 -42
fractal_server/app/routes/admin/v2.py +309 -0
fractal_server/app/routes/api/v1/__init__.py +7 -7
fractal_server/app/routes/api/v1/_aux_functions.py +8 -8
fractal_server/app/routes/api/v1/dataset.py +48 -41
fractal_server/app/routes/api/v1/job.py +14 -14
fractal_server/app/routes/api/v1/project.py +30 -27
fractal_server/app/routes/api/v1/task.py +26 -16
fractal_server/app/routes/api/v1/task_collection.py +28 -16
fractal_server/app/routes/api/v1/workflow.py +28 -28
fractal_server/app/routes/api/v1/workflowtask.py +11 -11
fractal_server/app/routes/api/v2/__init__.py +34 -0
fractal_server/app/routes/api/v2/_aux_functions.py +502 -0
fractal_server/app/routes/api/v2/dataset.py +293 -0
fractal_server/app/routes/api/v2/images.py +279 -0
fractal_server/app/routes/api/v2/job.py +200 -0
fractal_server/app/routes/api/v2/project.py +186 -0
fractal_server/app/routes/api/v2/status.py +150 -0
fractal_server/app/routes/api/v2/submit.py +210 -0
fractal_server/app/routes/api/v2/task.py +222 -0
fractal_server/app/routes/api/v2/task_collection.py +239 -0
fractal_server/app/routes/api/v2/task_legacy.py +59 -0
fractal_server/app/routes/api/v2/workflow.py +380 -0
fractal_server/app/routes/api/v2/workflowtask.py +265 -0
fractal_server/app/routes/aux/_job.py +2 -2
fractal_server/app/runner/__init__.py +0 -379
fractal_server/app/runner/async_wrap.py +27 -0
fractal_server/app/runner/components.py +5 -0
fractal_server/app/runner/exceptions.py +129 -0
fractal_server/app/runner/executors/__init__.py +0 -0
fractal_server/app/runner/executors/slurm/__init__.py +3 -0
fractal_server/app/runner/{_slurm → executors/slurm}/_batching.py +1 -1
fractal_server/app/runner/executors/slurm/_check_jobs_status.py +72 -0
fractal_server/app/runner/{_slurm → executors/slurm}/_executor_wait_thread.py +3 -4
fractal_server/app/runner/{_slurm → executors/slurm}/_slurm_config.py +3 -152
fractal_server/app/runner/{_slurm → executors/slurm}/_subprocess_run_as_user.py +42 -1
fractal_server/app/runner/{_slurm → executors/slurm}/executor.py +46 -27
fractal_server/app/runner/filenames.py +6 -0
fractal_server/app/runner/set_start_and_last_task_index.py +39 -0
fractal_server/app/runner/task_files.py +103 -0
fractal_server/app/runner/v1/__init__.py +366 -0
fractal_server/app/runner/{_common.py → v1/_common.py} +56 -111
fractal_server/app/runner/{_local → v1/_local}/__init__.py +5 -4
fractal_server/app/runner/{_local → v1/_local}/_local_config.py +6 -7
fractal_server/app/runner/{_local → v1/_local}/_submit_setup.py +1 -5
fractal_server/app/runner/v1/_slurm/__init__.py +312 -0
fractal_server/app/runner/{_slurm → v1/_slurm}/_submit_setup.py +5 -11
fractal_server/app/runner/v1/_slurm/get_slurm_config.py +163 -0
fractal_server/app/runner/v1/common.py +117 -0
fractal_server/app/runner/{handle_failed_job.py → v1/handle_failed_job.py} +8 -8
fractal_server/app/runner/v2/__init__.py +336 -0
fractal_server/app/runner/v2/_local/__init__.py +162 -0
fractal_server/app/runner/v2/_local/_local_config.py +118 -0
fractal_server/app/runner/v2/_local/_submit_setup.py +52 -0
fractal_server/app/runner/v2/_local/executor.py +100 -0
fractal_server/app/runner/{_slurm → v2/_slurm}/__init__.py +38 -47
fractal_server/app/runner/v2/_slurm/_submit_setup.py +82 -0
fractal_server/app/runner/v2/_slurm/get_slurm_config.py +182 -0
fractal_server/app/runner/v2/deduplicate_list.py +23 -0
fractal_server/app/runner/v2/handle_failed_job.py +165 -0
fractal_server/app/runner/v2/merge_outputs.py +38 -0
fractal_server/app/runner/v2/runner.py +343 -0
fractal_server/app/runner/v2/runner_functions.py +374 -0
fractal_server/app/runner/v2/runner_functions_low_level.py +130 -0
fractal_server/app/runner/v2/task_interface.py +62 -0
fractal_server/app/runner/v2/v1_compat.py +31 -0
fractal_server/app/schemas/__init__.py +1 -42
fractal_server/app/schemas/_validators.py +28 -5
fractal_server/app/schemas/v1/__init__.py +36 -0
fractal_server/app/schemas/{applyworkflow.py → v1/applyworkflow.py} +18 -18
fractal_server/app/schemas/{dataset.py → v1/dataset.py} +30 -30
fractal_server/app/schemas/{dumps.py → v1/dumps.py} +8 -8
fractal_server/app/schemas/{manifest.py → v1/manifest.py} +5 -5
fractal_server/app/schemas/{project.py → v1/project.py} +9 -9
fractal_server/app/schemas/{task.py → v1/task.py} +12 -12
fractal_server/app/schemas/{task_collection.py → v1/task_collection.py} +7 -7
fractal_server/app/schemas/{workflow.py → v1/workflow.py} +38 -38
fractal_server/app/schemas/v2/__init__.py +37 -0
fractal_server/app/schemas/v2/dataset.py +126 -0
fractal_server/app/schemas/v2/dumps.py +87 -0
fractal_server/app/schemas/v2/job.py +114 -0
fractal_server/app/schemas/v2/manifest.py +159 -0
fractal_server/app/schemas/v2/project.py +34 -0
fractal_server/app/schemas/v2/status.py +16 -0
fractal_server/app/schemas/v2/task.py +151 -0
fractal_server/app/schemas/v2/task_collection.py +109 -0
fractal_server/app/schemas/v2/workflow.py +79 -0
fractal_server/app/schemas/v2/workflowtask.py +208 -0
fractal_server/config.py +13 -10
fractal_server/images/__init__.py +4 -0
fractal_server/images/models.py +136 -0
fractal_server/images/tools.py +84 -0
fractal_server/main.py +11 -3
fractal_server/migrations/env.py +0 -2
fractal_server/migrations/versions/5bf02391cfef_v2.py +245 -0
fractal_server/tasks/__init__.py +0 -5
fractal_server/tasks/endpoint_operations.py +13 -19
fractal_server/tasks/utils.py +35 -0
fractal_server/tasks/{_TaskCollectPip.py → v1/_TaskCollectPip.py} +3 -3
fractal_server/tasks/v1/__init__.py +0 -0
fractal_server/tasks/{background_operations.py → v1/background_operations.py} +20 -52
fractal_server/tasks/v1/get_collection_data.py +14 -0
fractal_server/tasks/v2/_TaskCollectPip.py +103 -0
fractal_server/tasks/v2/__init__.py +0 -0
fractal_server/tasks/v2/background_operations.py +381 -0
fractal_server/tasks/v2/get_collection_data.py +14 -0
fractal_server/urls.py +13 -0
{fractal_server-1.4.6.dist-info → fractal_server-2.0.0.dist-info}/METADATA +11 -12
fractal_server-2.0.0.dist-info/RECORD +169 -0
fractal_server/app/runner/_slurm/.gitignore +0 -2
fractal_server/app/runner/common.py +0 -307
fractal_server/app/schemas/json_schemas/manifest.json +0 -81
fractal_server-1.4.6.dist-info/RECORD +0 -97
/fractal_server/app/runner/{_slurm → executors/slurm}/remote.py +0 -0
/fractal_server/app/runner/{_local → v1/_local}/executor.py +0 -0
{fractal_server-1.4.6.dist-info → fractal_server-2.0.0.dist-info}/LICENSE +0 -0
{fractal_server-1.4.6.dist-info → fractal_server-2.0.0.dist-info}/WHEEL +0 -0
{fractal_server-1.4.6.dist-info → fractal_server-2.0.0.dist-info}/entry_points.txt +0 -0

fractal_server/app/runner/v1/__init__.py ADDED Viewed

@@ -0,0 +1,366 @@
+# Copyright 2022 (C) Friedrich Miescher Institute for Biomedical Research and
+# University of Zurich
+#
+# Original authors:
+# Jacopo Nespolo <jacopo.nespolo@exact-lab.it>
+# Tommaso Comparin <tommaso.comparin@exact-lab.it>
+# Marco Franzon <marco.franzon@exact-lab.it>
+#
+# This file is part of Fractal and was originally developed by eXact lab S.r.l.
+# <exact-lab.it> under contract with Liberali Lab from the Friedrich Miescher
+# Institute for Biomedical Research and Pelkmans Lab from the University of
+# Zurich.
+"""
+Runner backend subsystem root
+This module is the single entry point to the runner backend subsystem. Other
+subystems should only import this module and not its submodules or the
+individual backends.
+"""
+import os
+import traceback
+from pathlib import Path
+from typing import Optional
+from ....logger import set_logger
+from ....syringe import Inject
+from ....utils import get_timestamp
+from ...db import DB
+from ...models.v1 import ApplyWorkflow
+from ...models.v1 import Dataset
+from ...models.v1 import Workflow
+from ...models.v1 import WorkflowTask
+from ...schemas.v1 import JobStatusTypeV1
+from ..exceptions import JobExecutionError
+from ..exceptions import TaskExecutionError
+from ..filenames import WORKFLOW_LOG_FILENAME
+from ._local import process_workflow as local_process_workflow
+from ._slurm import process_workflow as slurm_process_workflow
+from .common import close_job_logger
+from .common import validate_workflow_compatibility  # noqa: F401
+from .handle_failed_job import assemble_history_failed_job
+from .handle_failed_job import assemble_meta_failed_job
+from fractal_server import __VERSION__
+from fractal_server.config import get_settings
+_backends = {}
+_backends["local"] = local_process_workflow
+_backends["slurm"] = slurm_process_workflow
+async def submit_workflow(
+    *,
+    workflow_id: int,
+    input_dataset_id: int,
+    output_dataset_id: int,
+    job_id: int,
+    worker_init: Optional[str] = None,
+    slurm_user: Optional[str] = None,
+    user_cache_dir: Optional[str] = None,
+) -> None:
+    """
+    Prepares a workflow and applies it to a dataset
+    This function wraps the process_workflow one, which is different for each
+    backend (e.g. local or slurm backend).
+    Args:
+        workflow_id:
+            ID of the workflow being applied
+        input_dataset_id:
+            Input dataset ID
+        output_dataset_id:
+            ID of the destination dataset of the workflow.
+        job_id:
+            Id of the job record which stores the state for the current
+            workflow application.
+        worker_init:
+            Custom executor parameters that get parsed before the execution of
+            each task.
+        user_cache_dir:
+            Cache directory (namely a path where the user can write); for the
+            slurm backend, this is used as a base directory for
+            `job.working_dir_user`.
+        slurm_user:
+            The username to impersonate for the workflow execution, for the
+            slurm backend.
+    """
+    # Declare runner backend and set `process_workflow` function
+    settings = Inject(get_settings)
+    FRACTAL_RUNNER_BACKEND = settings.FRACTAL_RUNNER_BACKEND
+    if FRACTAL_RUNNER_BACKEND == "local":
+        process_workflow = local_process_workflow
+    elif FRACTAL_RUNNER_BACKEND == "slurm":
+        process_workflow = slurm_process_workflow
+    else:
+        raise RuntimeError(f"Invalid runner backend {FRACTAL_RUNNER_BACKEND=}")
+    with next(DB.get_sync_db()) as db_sync:
+        job: ApplyWorkflow = db_sync.get(ApplyWorkflow, job_id)
+        if not job:
+            raise ValueError(f"Cannot fetch job {job_id} from database")
+        input_dataset: Dataset = db_sync.get(Dataset, input_dataset_id)
+        output_dataset: Dataset = db_sync.get(Dataset, output_dataset_id)
+        workflow: Workflow = db_sync.get(Workflow, workflow_id)
+        if not (input_dataset and output_dataset and workflow):
+            log_msg = ""
+            if not input_dataset:
+                log_msg += (
+                    f"Cannot fetch input_dataset {input_dataset_id} "
+                    "from database\n"
+                )
+            if not output_dataset:
+                log_msg += (
+                    f"Cannot fetch output_dataset {output_dataset_id} "
+                    "from database\n"
+                )
+            if not workflow:
+                log_msg += (
+                    f"Cannot fetch workflow {workflow_id} from database\n"
+                )
+            job.status = JobStatusTypeV1.FAILED
+            job.end_timestamp = get_timestamp()
+            job.log = log_msg
+            db_sync.merge(job)
+            db_sync.commit()
+            db_sync.close()
+            return
+        # Prepare some of process_workflow arguments
+        input_paths = input_dataset.paths
+        output_path = output_dataset.paths[0]
+        # Define and create server-side working folder
+        project_id = workflow.project_id
+        timestamp_string = get_timestamp().strftime("%Y%m%d_%H%M%S")
+        WORKFLOW_DIR = (
+            settings.FRACTAL_RUNNER_WORKING_BASE_DIR
+            / (
+                f"proj_{project_id:07d}_wf_{workflow_id:07d}_job_{job_id:07d}"
+                f"_{timestamp_string}"
+            )
+        ).resolve()
+        if WORKFLOW_DIR.exists():
+            raise RuntimeError(f"Workflow dir {WORKFLOW_DIR} already exists.")
+        # Create WORKFLOW_DIR with 755 permissions
+        original_umask = os.umask(0)
+        WORKFLOW_DIR.mkdir(parents=True, mode=0o755)
+        os.umask(original_umask)
+        # Define and create user-side working folder, if needed
+        if FRACTAL_RUNNER_BACKEND == "local":
+            WORKFLOW_DIR_USER = WORKFLOW_DIR
+        elif FRACTAL_RUNNER_BACKEND == "slurm":
+            from ..executors.slurm._subprocess_run_as_user import (
+                _mkdir_as_user,
+            )
+            WORKFLOW_DIR_USER = (
+                Path(user_cache_dir) / f"{WORKFLOW_DIR.name}"
+            ).resolve()
+            _mkdir_as_user(folder=str(WORKFLOW_DIR_USER), user=slurm_user)
+        else:
+            raise ValueError(f"{FRACTAL_RUNNER_BACKEND=} not supported")
+        # Update db
+        job.working_dir = WORKFLOW_DIR.as_posix()
+        job.working_dir_user = WORKFLOW_DIR_USER.as_posix()
+        db_sync.merge(job)
+        db_sync.commit()
+        # After Session.commit() is called, either explicitly or when using a
+        # context manager, all objects associated with the Session are expired.
+        # https://docs.sqlalchemy.org/en/14/orm/
+        #   session_basics.html#opening-and-closing-a-session
+        # https://docs.sqlalchemy.org/en/14/orm/
+        #   session_state_management.html#refreshing-expiring
+        # See issue #928:
+        # https://github.com/fractal-analytics-platform/
+        #   fractal-server/issues/928
+        db_sync.refresh(input_dataset)
+        db_sync.refresh(output_dataset)
+        db_sync.refresh(workflow)
+        # Write logs
+        logger_name = f"WF{workflow_id}_job{job_id}"
+        log_file_path = WORKFLOW_DIR / WORKFLOW_LOG_FILENAME
+        logger = set_logger(
+            logger_name=logger_name,
+            log_file_path=log_file_path,
+        )
+        logger.info(
+            f'Start execution of workflow "{workflow.name}"; '
+            f"more logs at {str(log_file_path)}"
+        )
+        logger.debug(f"fractal_server.__VERSION__: {__VERSION__}")
+        logger.debug(f"FRACTAL_RUNNER_BACKEND: {FRACTAL_RUNNER_BACKEND}")
+        logger.debug(f"slurm_user: {slurm_user}")
+        logger.debug(f"slurm_account: {job.slurm_account}")
+        logger.debug(f"worker_init: {worker_init}")
+        logger.debug(f"input metadata keys: {list(input_dataset.meta.keys())}")
+        logger.debug(f"input_paths: {input_paths}")
+        logger.debug(f"output_path: {output_path}")
+        logger.debug(f"job.id: {job.id}")
+        logger.debug(f"job.working_dir: {job.working_dir}")
+        logger.debug(f"job.working_dir_user: {job.working_dir_user}")
+        logger.debug(f"job.first_task_index: {job.first_task_index}")
+        logger.debug(f"job.last_task_index: {job.last_task_index}")
+        logger.debug(f'START workflow "{workflow.name}"')
+    try:
+        # "The Session.close() method does not prevent the Session from being
+        # used again. The Session itself does not actually have a distinct
+        # “closed” state; it merely means the Session will release all database
+        # connections and ORM objects."
+        # (https://docs.sqlalchemy.org/en/20/orm/session_api.html#sqlalchemy.orm.Session.close).
+        #
+        # We close the session before the (possibly long) process_workflow
+        # call, to make sure all DB connections are released. The reason why we
+        # are not using a context manager within the try block is that we also
+        # need access to db_sync in the except branches.
+        db_sync = next(DB.get_sync_db())
+        db_sync.close()
+        output_dataset_meta_hist = await process_workflow(
+            workflow=workflow,
+            input_paths=input_paths,
+            output_path=output_path,
+            input_metadata=input_dataset.meta,
+            input_history=input_dataset.history,
+            slurm_user=slurm_user,
+            slurm_account=job.slurm_account,
+            user_cache_dir=user_cache_dir,
+            workflow_dir=WORKFLOW_DIR,
+            workflow_dir_user=WORKFLOW_DIR_USER,
+            logger_name=logger_name,
+            worker_init=worker_init,
+            first_task_index=job.first_task_index,
+            last_task_index=job.last_task_index,
+        )
+        logger.info(
+            f'End execution of workflow "{workflow.name}"; '
+            f"more logs at {str(log_file_path)}"
+        )
+        logger.debug(f'END workflow "{workflow.name}"')
+        # Replace output_dataset.meta and output_dataset.history with their
+        # up-to-date versions, obtained within process_workflow
+        output_dataset.history = output_dataset_meta_hist.pop("history")
+        output_dataset.meta = output_dataset_meta_hist.pop("metadata")
+        db_sync.merge(output_dataset)
+        # Update job DB entry
+        job.status = JobStatusTypeV1.DONE
+        job.end_timestamp = get_timestamp()
+        with log_file_path.open("r") as f:
+            logs = f.read()
+        job.log = logs
+        db_sync.merge(job)
+        close_job_logger(logger)
+        db_sync.commit()
+    except TaskExecutionError as e:
+        logger.debug(f'FAILED workflow "{workflow.name}", TaskExecutionError.')
+        logger.info(f'Workflow "{workflow.name}" failed (TaskExecutionError).')
+        # Assemble output_dataset.meta based on the last successful task, i.e.
+        # based on METADATA_FILENAME
+        output_dataset.meta = assemble_meta_failed_job(job, output_dataset)
+        # Assemble new history and assign it to output_dataset.meta
+        failed_wftask = db_sync.get(WorkflowTask, e.workflow_task_id)
+        output_dataset.history = assemble_history_failed_job(
+            job,
+            output_dataset,
+            workflow,
+            logger,
+            failed_wftask=failed_wftask,
+        )
+        db_sync.merge(output_dataset)
+        job.status = JobStatusTypeV1.FAILED
+        job.end_timestamp = get_timestamp()
+        exception_args_string = "\n".join(e.args)
+        job.log = (
+            f"TASK ERROR: "
+            f"Task name: {e.task_name}, "
+            f"position in Workflow: {e.workflow_task_order}\n"
+            f"TRACEBACK:\n{exception_args_string}"
+        )
+        db_sync.merge(job)
+        close_job_logger(logger)
+        db_sync.commit()
+    except JobExecutionError as e:
+        logger.debug(f'FAILED workflow "{workflow.name}", JobExecutionError.')
+        logger.info(f'Workflow "{workflow.name}" failed (JobExecutionError).')
+        # Assemble output_dataset.meta based on the last successful task, i.e.
+        # based on METADATA_FILENAME
+        output_dataset.meta = assemble_meta_failed_job(job, output_dataset)
+        # Assemble new history and assign it to output_dataset.meta
+        output_dataset.history = assemble_history_failed_job(
+            job,
+            output_dataset,
+            workflow,
+            logger,
+        )
+        db_sync.merge(output_dataset)
+        job.status = JobStatusTypeV1.FAILED
+        job.end_timestamp = get_timestamp()
+        error = e.assemble_error()
+        job.log = f"JOB ERROR in Fractal job {job.id}:\nTRACEBACK:\n{error}"
+        db_sync.merge(job)
+        close_job_logger(logger)
+        db_sync.commit()
+    except Exception:
+        logger.debug(f'FAILED workflow "{workflow.name}", unknown error.')
+        logger.info(f'Workflow "{workflow.name}" failed (unkwnon error).')
+        current_traceback = traceback.format_exc()
+        # Assemble output_dataset.meta based on the last successful task, i.e.
+        # based on METADATA_FILENAME
+        output_dataset.meta = assemble_meta_failed_job(job, output_dataset)
+        # Assemble new history and assign it to output_dataset.meta
+        output_dataset.history = assemble_history_failed_job(
+            job,
+            output_dataset,
+            workflow,
+            logger,
+        )
+        db_sync.merge(output_dataset)
+        job.status = JobStatusTypeV1.FAILED
+        job.end_timestamp = get_timestamp()
+        job.log = (
+            f"UNKNOWN ERROR in Fractal job {job.id}\n"
+            f"TRACEBACK:\n{current_traceback}"
+        )
+        db_sync.merge(job)
+        close_job_logger(logger)
+        db_sync.commit()
+    finally:
+        db_sync.close()

fractal_server/app/runner/{_common.py → v1/_common.py} RENAMED Viewed

@@ -10,7 +10,7 @@ import shutil
 import subprocess  # nosec
 import traceback
 from concurrent.futures import Executor
-from functools import lru_cache
+from copy import deepcopy
 from functools import partial
 from pathlib import Path
 from shlex import split as shlex_split
@@ -18,18 +18,19 @@ from typing import Any
 from typing import Callable
 from typing import Optional
-from ...logger import get_logger
-from ..models import WorkflowTask
-from ..schemas import WorkflowTaskStatusType
-from .common import JobExecutionError
-from .common import TaskExecutionError
+from ....config import get_settings
+from ....logger import get_logger
+from ....syringe import Inject
+from ...models.v1 import Task
+from ...models.v1 import WorkflowTask
+from ...schemas.v1 import WorkflowTaskStatusTypeV1
+from ..exceptions import JobExecutionError
+from ..exceptions import TaskExecutionError
 from .common import TaskParameters
 from .common import write_args_file
-HISTORY_FILENAME = "history.json"
-METADATA_FILENAME = "metadata.json"
-SHUTDOWN_FILENAME = "shutdown"
-WORKFLOW_LOG_FILENAME = "workflow.log"
+from fractal_server.app.runner.filenames import HISTORY_FILENAME
+from fractal_server.app.runner.filenames import METADATA_FILENAME
+from fractal_server.app.runner.task_files import get_task_file_paths
 def no_op_submit_setup_call(
@@ -37,7 +38,6 @@ def no_op_submit_setup_call(
     wftask: WorkflowTask,
     workflow_dir: Path,
     workflow_dir_user: Path,
-    task_pars: TaskParameters,
 ) -> dict:
     """
     Default (no-operation) interface of submit_setup_call.
@@ -45,104 +45,24 @@ def no_op_submit_setup_call(
     return {}
-def sanitize_component(value: str) -> str:
-    """
-    Remove {" ", "/", "."} form a string, e.g. going from
-    'plate.zarr/B/03/0' to 'plate_zarr_B_03_0'.
+def _task_needs_image_list(_task: Task) -> bool:
     """
-    return value.replace(" ", "_").replace("/", "_").replace(".", "_")
+    Whether a task requires `metadata["image"]` in its `args.json` file.
+    For details see
+    https://github.com/fractal-analytics-platform/fractal-server/issues/1237
-class TaskFiles:
-    """
-    Group all file paths pertaining to a task
-    Attributes:
-        workflow_dir:
-            Server-owned directory to store all task-execution-related relevant
-            files (inputs, outputs, errors, and all meta files related to the
-            job execution). Note: users cannot write directly to this folder.
-        workflow_dir_user:
-            User-side directory with the same scope as `workflow_dir`, and
-            where a user can write.
-        task_order:
-            Positional order of the task within a workflow.
-        component:
-            Specific component to run the task for (relevant for tasks that
-            will be executed in parallel over many components).
-        file_prefix:
-            Prefix for all task-related files.
-        args:
-            Path for input json file.
-        metadiff:
-            Path for output json file with metadata update.
-        out:
-            Path for task-execution stdout.
-        err:
-            Path for task-execution stderr.
-    """
-    workflow_dir: Path
-    workflow_dir_user: Path
-    task_order: Optional[int] = None
-    component: Optional[str] = None
-    file_prefix: str
-    args: Path
-    out: Path
-    err: Path
-    metadiff: Path
-    def __init__(
-        self,
-        workflow_dir: Path,
-        workflow_dir_user: Path,
-        task_order: Optional[int] = None,
-        component: Optional[str] = None,
-    ):
-        self.workflow_dir = workflow_dir
-        self.workflow_dir_user = workflow_dir_user
-        self.task_order = task_order
-        self.component = component
-        if self.component is not None:
-            component_safe = sanitize_component(str(self.component))
-            component_safe = f"_par_{component_safe}"
-        else:
-            component_safe = ""
-        if self.task_order is not None:
-            order = str(self.task_order)
-        else:
-            order = "task"
-        self.file_prefix = f"{order}{component_safe}"
-        self.args = self.workflow_dir_user / f"{self.file_prefix}.args.json"
-        self.out = self.workflow_dir_user / f"{self.file_prefix}.out"
-        self.err = self.workflow_dir_user / f"{self.file_prefix}.err"
-        self.metadiff = (
-            self.workflow_dir_user / f"{self.file_prefix}.metadiff.json"
-        )
-@lru_cache()
-def get_task_file_paths(
-    workflow_dir: Path,
-    workflow_dir_user: Path,
-    task_order: Optional[int] = None,
-    component: Optional[str] = None,
-) -> TaskFiles:
-    """
-    Return the corrisponding TaskFiles object
-    This function is mainly used as a cache to avoid instantiating needless
-    objects.
+    Args:
+        _task: The task to be checked.
     """
-    return TaskFiles(
-        workflow_dir=workflow_dir,
-        workflow_dir_user=workflow_dir_user,
-        task_order=task_order,
-        component=component,
+    settings = Inject(get_settings)
+    exception_task_names = settings.FRACTAL_RUNNER_TASKS_INCLUDE_IMAGE.split(
+        ";"
     )
+    if _task.name in exception_task_names:
+        return True
+    else:
+        return False
 def _call_command_wrapper(cmd: str, stdout: Path, stderr: Path) -> None:
@@ -287,7 +207,7 @@ def call_single_task(
         with task_files.metadiff.open("r") as f_metadiff:
             diff_metadata = json.load(f_metadiff)
     except FileNotFoundError as e:
-        logger.error(
+        logger.warning(
             f"Skip collection of updated metadata. Original error: {str(e)}"
         )
         diff_metadata = {}
@@ -306,7 +226,7 @@ def call_single_task(
     wftask_dump["task"] = wftask.task.model_dump()
     new_history_item = dict(
         workflowtask=wftask_dump,
-        status=WorkflowTaskStatusType.DONE,
+        status=WorkflowTaskStatusTypeV1.DONE,
         parallelization=None,
     )
     updated_history = task_pars.history.copy()
@@ -418,6 +338,26 @@ def call_single_parallel_task(
     return this_meta_update
+def trim_TaskParameters(
+    task_params: TaskParameters,
+    _task: Task,
+) -> TaskParameters:
+    """
+    Return a smaller copy of a TaskParameter object.
+    Remove metadata["image"] key/value pair - see issues 1237 and 1242.
+    (https://github.com/fractal-analytics-platform/fractal-server/issues/1237)
+    This applies only to parallel tasks with names different from the ones
+    defined in `_task_needs_image_list`.
+    """
+    task_params_slim = deepcopy(task_params)
+    if not _task_needs_image_list(_task) and _task.is_parallel:
+        if "image" in task_params_slim.metadata.keys():
+            task_params_slim.metadata.pop("image")
+        task_params_slim.history = []
+    return task_params_slim
 def call_parallel_task(
     *,
     executor: Executor,
@@ -484,7 +424,6 @@ def call_parallel_task(
     try:
         extra_setup = submit_setup_call(
             wftask=wftask,
-            task_pars=task_pars_depend,
             workflow_dir=workflow_dir,
             workflow_dir_user=workflow_dir_user,
         )
@@ -496,10 +435,14 @@ def call_parallel_task(
         )
     # Preliminary steps
+    actual_task_pars_depend = trim_TaskParameters(
+        task_pars_depend, wftask.task
+    )
     partial_call_task = partial(
         call_single_parallel_task,
         wftask=wftask,
-        task_pars=task_pars_depend,
+        task_pars=actual_task_pars_depend,
         workflow_dir=workflow_dir,
         workflow_dir_user=workflow_dir_user,
     )
@@ -543,7 +486,7 @@ def call_parallel_task(
     wftask_dump["task"] = wftask.task.model_dump()
     new_history_item = dict(
         workflowtask=wftask_dump,
-        status=WorkflowTaskStatusType.DONE,
+        status=WorkflowTaskStatusTypeV1.DONE,
         parallelization=dict(
             parallelization_level=wftask.parallelization_level,
             component_list=component_list,
@@ -632,7 +575,6 @@ def execute_tasks(
             try:
                 extra_setup = submit_setup_call(
                     wftask=this_wftask,
-                    task_pars=current_task_pars,
                     workflow_dir=workflow_dir,
                     workflow_dir_user=workflow_dir_user,
                 )
@@ -645,6 +587,9 @@ def execute_tasks(
             # NOTE: executor.submit(call_single_task, ...) is non-blocking,
             # i.e. the returned future may have `this_wftask_future.done() =
             # False`. We make it blocking right away, by calling `.result()`
+            # NOTE: do not use trim_TaskParameters for non-parallel tasks,
+            # since the `task_pars` argument in `call_single_task` is also used
+            # as a basis for new `metadata`.
             this_wftask_future = executor.submit(
                 call_single_task,
                 wftask=this_wftask,

fractal_server/app/runner/{_local → v1/_local}/__init__.py RENAMED Viewed

@@ -23,10 +23,10 @@ from pathlib import Path
 from typing import Any
 from typing import Optional
-from ...models import Workflow
+from ....models.v1 import Workflow
+from ...async_wrap import async_wrap
+from ...set_start_and_last_task_index import set_start_and_last_task_index
 from .._common import execute_tasks
-from ..common import async_wrap
-from ..common import set_start_and_last_task_index
 from ..common import TaskParameters
 from ._submit_setup import _local_submit_setup
 from .executor import FractalThreadPoolExecutor
@@ -49,7 +49,8 @@ def _process_workflow(
     Schedules the workflow using a `FractalThreadPoolExecutor`.
-    Cf. [process_workflow][fractal_server.app.runner._local.process_workflow]
+    Cf.
+    [process_workflow][fractal_server.app.runner.v1._local.process_workflow]
     for the call signature.
     """

fractal_server/app/runner/{_local → v1/_local}/_local_config.py RENAMED Viewed

@@ -19,9 +19,9 @@ from pydantic import BaseModel
 from pydantic import Extra
 from pydantic.error_wrappers import ValidationError
-from ....config import get_settings
-from ....syringe import Inject
-from ...models import WorkflowTask
+from .....config import get_settings
+from .....syringe import Inject
+from ....models.v1 import WorkflowTask
 class LocalBackendConfigError(ValueError):
@@ -63,15 +63,14 @@ def get_local_backend_config(
     The sources for `parallel_tasks_per_job` attributes, starting from the
     highest-priority one, are
-    1. Properties in `wftask.meta` (which, for `WorkflowTask`s added through
-       `Workflow.insert_task`, also includes `wftask.task.meta`);
+    1. Properties in `wftask.meta`;
     2. The general content of the local-backend configuration file;
     3. The default value (`None`).
     Arguments:
         wftask:
-            WorkflowTask for which the backend configuration is is to be
-            prepared.
+            WorkflowTask (V1) for which the backend configuration should
+            be prepared.
         config_path:
             Path of local-backend configuration file; if `None`, use
             `FRACTAL_LOCAL_CONFIG_FILE` variable from settings.

fractal-server 1.4.6__py3-none-any.whl → 2.0.0__py3-none-any.whl

fractal-server 1.4.6py3-none-any.whl → 2.0.0py3-none-any.whl