PyPI - hpcflow-new2 - Versions diffs - 0.2.0a189__py3-none-any.whl → 0.2.0a199__py3-none-any.whl - Mend

hpcflow-new2 0.2.0a189py3-none-any.whl → 0.2.0a199py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (176) hide show

hpcflow/__pyinstaller/hook-hpcflow.py +9 -6
hpcflow/_version.py +1 -1
hpcflow/app.py +1 -0
hpcflow/data/scripts/bad_script.py +2 -0
hpcflow/data/scripts/do_nothing.py +2 -0
hpcflow/data/scripts/env_specifier_test/input_file_generator_pass_env_spec.py +4 -0
hpcflow/data/scripts/env_specifier_test/main_script_test_pass_env_spec.py +8 -0
hpcflow/data/scripts/env_specifier_test/output_file_parser_pass_env_spec.py +4 -0
hpcflow/data/scripts/env_specifier_test/v1/input_file_generator_basic.py +4 -0
hpcflow/data/scripts/env_specifier_test/v1/main_script_test_direct_in_direct_out.py +7 -0
hpcflow/data/scripts/env_specifier_test/v1/output_file_parser_basic.py +4 -0
hpcflow/data/scripts/env_specifier_test/v2/main_script_test_direct_in_direct_out.py +7 -0
hpcflow/data/scripts/input_file_generator_basic.py +3 -0
hpcflow/data/scripts/input_file_generator_basic_FAIL.py +3 -0
hpcflow/data/scripts/input_file_generator_test_stdout_stderr.py +8 -0
hpcflow/data/scripts/main_script_test_direct_in.py +3 -0
hpcflow/data/scripts/main_script_test_direct_in_direct_out_2.py +6 -0
hpcflow/data/scripts/main_script_test_direct_in_direct_out_2_fail_allowed.py +6 -0
hpcflow/data/scripts/main_script_test_direct_in_direct_out_2_fail_allowed_group.py +7 -0
hpcflow/data/scripts/main_script_test_direct_in_direct_out_3.py +6 -0
hpcflow/data/scripts/main_script_test_direct_in_group_direct_out_3.py +6 -0
hpcflow/data/scripts/main_script_test_direct_in_group_one_fail_direct_out_3.py +6 -0
hpcflow/data/scripts/main_script_test_hdf5_in_obj.py +1 -1
hpcflow/data/scripts/main_script_test_hdf5_in_obj_2.py +12 -0
hpcflow/data/scripts/main_script_test_hdf5_out_obj.py +1 -1
hpcflow/data/scripts/main_script_test_json_out_FAIL.py +3 -0
hpcflow/data/scripts/main_script_test_shell_env_vars.py +12 -0
hpcflow/data/scripts/main_script_test_std_out_std_err.py +6 -0
hpcflow/data/scripts/output_file_parser_basic.py +3 -0
hpcflow/data/scripts/output_file_parser_basic_FAIL.py +7 -0
hpcflow/data/scripts/output_file_parser_test_stdout_stderr.py +8 -0
hpcflow/data/scripts/script_exit_test.py +5 -0
hpcflow/data/template_components/environments.yaml +1 -1
hpcflow/sdk/__init__.py +26 -15
hpcflow/sdk/app.py +2192 -768
hpcflow/sdk/cli.py +506 -296
hpcflow/sdk/cli_common.py +105 -7
hpcflow/sdk/config/__init__.py +1 -1
hpcflow/sdk/config/callbacks.py +115 -43
hpcflow/sdk/config/cli.py +126 -103
hpcflow/sdk/config/config.py +674 -318
hpcflow/sdk/config/config_file.py +131 -95
hpcflow/sdk/config/errors.py +125 -84
hpcflow/sdk/config/types.py +148 -0
hpcflow/sdk/core/__init__.py +25 -1
hpcflow/sdk/core/actions.py +1771 -1059
hpcflow/sdk/core/app_aware.py +24 -0
hpcflow/sdk/core/cache.py +139 -79
hpcflow/sdk/core/command_files.py +263 -287
hpcflow/sdk/core/commands.py +145 -112
hpcflow/sdk/core/element.py +828 -535
hpcflow/sdk/core/enums.py +192 -0
hpcflow/sdk/core/environment.py +74 -93
hpcflow/sdk/core/errors.py +455 -52
hpcflow/sdk/core/execute.py +207 -0
hpcflow/sdk/core/json_like.py +540 -272
hpcflow/sdk/core/loop.py +751 -347
hpcflow/sdk/core/loop_cache.py +164 -47
hpcflow/sdk/core/object_list.py +370 -207
hpcflow/sdk/core/parameters.py +1100 -627
hpcflow/sdk/core/rule.py +59 -41
hpcflow/sdk/core/run_dir_files.py +21 -37
hpcflow/sdk/core/skip_reason.py +7 -0
hpcflow/sdk/core/task.py +1649 -1339
hpcflow/sdk/core/task_schema.py +308 -196
hpcflow/sdk/core/test_utils.py +191 -114
hpcflow/sdk/core/types.py +440 -0
hpcflow/sdk/core/utils.py +485 -309
hpcflow/sdk/core/validation.py +82 -9
hpcflow/sdk/core/workflow.py +2544 -1178
hpcflow/sdk/core/zarr_io.py +98 -137
hpcflow/sdk/data/workflow_spec_schema.yaml +2 -0
hpcflow/sdk/demo/cli.py +53 -33
hpcflow/sdk/helper/cli.py +18 -15
hpcflow/sdk/helper/helper.py +75 -63
hpcflow/sdk/helper/watcher.py +61 -28
hpcflow/sdk/log.py +122 -71
hpcflow/sdk/persistence/__init__.py +8 -31
hpcflow/sdk/persistence/base.py +1360 -606
hpcflow/sdk/persistence/defaults.py +6 -0
hpcflow/sdk/persistence/discovery.py +38 -0
hpcflow/sdk/persistence/json.py +568 -188
hpcflow/sdk/persistence/pending.py +382 -179
hpcflow/sdk/persistence/store_resource.py +39 -23
hpcflow/sdk/persistence/types.py +318 -0
hpcflow/sdk/persistence/utils.py +14 -11
hpcflow/sdk/persistence/zarr.py +1337 -433
hpcflow/sdk/runtime.py +44 -41
hpcflow/sdk/submission/{jobscript_info.py → enums.py} +39 -12
hpcflow/sdk/submission/jobscript.py +1651 -692
hpcflow/sdk/submission/schedulers/__init__.py +167 -39
hpcflow/sdk/submission/schedulers/direct.py +121 -81
hpcflow/sdk/submission/schedulers/sge.py +170 -129
hpcflow/sdk/submission/schedulers/slurm.py +291 -268
hpcflow/sdk/submission/schedulers/utils.py +12 -2
hpcflow/sdk/submission/shells/__init__.py +14 -15
hpcflow/sdk/submission/shells/base.py +150 -29
hpcflow/sdk/submission/shells/bash.py +283 -173
hpcflow/sdk/submission/shells/os_version.py +31 -30
hpcflow/sdk/submission/shells/powershell.py +228 -170
hpcflow/sdk/submission/submission.py +1014 -335
hpcflow/sdk/submission/types.py +140 -0
hpcflow/sdk/typing.py +182 -12
hpcflow/sdk/utils/arrays.py +71 -0
hpcflow/sdk/utils/deferred_file.py +55 -0
hpcflow/sdk/utils/hashing.py +16 -0
hpcflow/sdk/utils/patches.py +12 -0
hpcflow/sdk/utils/strings.py +33 -0
hpcflow/tests/api/test_api.py +32 -0
hpcflow/tests/conftest.py +27 -6
hpcflow/tests/data/multi_path_sequences.yaml +29 -0
hpcflow/tests/data/workflow_test_run_abort.yaml +34 -35
hpcflow/tests/schedulers/sge/test_sge_submission.py +36 -0
hpcflow/tests/schedulers/slurm/test_slurm_submission.py +5 -2
hpcflow/tests/scripts/test_input_file_generators.py +282 -0
hpcflow/tests/scripts/test_main_scripts.py +866 -85
hpcflow/tests/scripts/test_non_snippet_script.py +46 -0
hpcflow/tests/scripts/test_ouput_file_parsers.py +353 -0
hpcflow/tests/shells/wsl/test_wsl_submission.py +12 -4
hpcflow/tests/unit/test_action.py +262 -75
hpcflow/tests/unit/test_action_rule.py +9 -4
hpcflow/tests/unit/test_app.py +33 -6
hpcflow/tests/unit/test_cache.py +46 -0
hpcflow/tests/unit/test_cli.py +134 -1
hpcflow/tests/unit/test_command.py +71 -54
hpcflow/tests/unit/test_config.py +142 -16
hpcflow/tests/unit/test_config_file.py +21 -18
hpcflow/tests/unit/test_element.py +58 -62
hpcflow/tests/unit/test_element_iteration.py +50 -1
hpcflow/tests/unit/test_element_set.py +29 -19
hpcflow/tests/unit/test_group.py +4 -2
hpcflow/tests/unit/test_input_source.py +116 -93
hpcflow/tests/unit/test_input_value.py +29 -24
hpcflow/tests/unit/test_jobscript_unit.py +757 -0
hpcflow/tests/unit/test_json_like.py +44 -35
hpcflow/tests/unit/test_loop.py +1396 -84
hpcflow/tests/unit/test_meta_task.py +325 -0
hpcflow/tests/unit/test_multi_path_sequences.py +229 -0
hpcflow/tests/unit/test_object_list.py +17 -12
hpcflow/tests/unit/test_parameter.py +29 -7
hpcflow/tests/unit/test_persistence.py +237 -42
hpcflow/tests/unit/test_resources.py +20 -18
hpcflow/tests/unit/test_run.py +117 -6
hpcflow/tests/unit/test_run_directories.py +29 -0
hpcflow/tests/unit/test_runtime.py +2 -1
hpcflow/tests/unit/test_schema_input.py +23 -15
hpcflow/tests/unit/test_shell.py +23 -2
hpcflow/tests/unit/test_slurm.py +8 -7
hpcflow/tests/unit/test_submission.py +38 -89
hpcflow/tests/unit/test_task.py +352 -247
hpcflow/tests/unit/test_task_schema.py +33 -20
hpcflow/tests/unit/test_utils.py +9 -11
hpcflow/tests/unit/test_value_sequence.py +15 -12
hpcflow/tests/unit/test_workflow.py +114 -83
hpcflow/tests/unit/test_workflow_template.py +0 -1
hpcflow/tests/unit/utils/test_arrays.py +40 -0
hpcflow/tests/unit/utils/test_deferred_file_writer.py +34 -0
hpcflow/tests/unit/utils/test_hashing.py +65 -0
hpcflow/tests/unit/utils/test_patches.py +5 -0
hpcflow/tests/unit/utils/test_redirect_std.py +50 -0
hpcflow/tests/workflows/__init__.py +0 -0
hpcflow/tests/workflows/test_directory_structure.py +31 -0
hpcflow/tests/workflows/test_jobscript.py +334 -1
hpcflow/tests/workflows/test_run_status.py +198 -0
hpcflow/tests/workflows/test_skip_downstream.py +696 -0
hpcflow/tests/workflows/test_submission.py +140 -0
hpcflow/tests/workflows/test_workflows.py +160 -15
hpcflow/tests/workflows/test_zip.py +18 -0
hpcflow/viz_demo.ipynb +6587 -3
{hpcflow_new2-0.2.0a189.dist-info → hpcflow_new2-0.2.0a199.dist-info}/METADATA +8 -4
hpcflow_new2-0.2.0a199.dist-info/RECORD +221 -0
hpcflow/sdk/core/parallel.py +0 -21
hpcflow_new2-0.2.0a189.dist-info/RECORD +0 -158
{hpcflow_new2-0.2.0a189.dist-info → hpcflow_new2-0.2.0a199.dist-info}/LICENSE +0 -0
{hpcflow_new2-0.2.0a189.dist-info → hpcflow_new2-0.2.0a199.dist-info}/WHEEL +0 -0
{hpcflow_new2-0.2.0a189.dist-info → hpcflow_new2-0.2.0a199.dist-info}/entry_points.txt +0 -0

hpcflow/tests/unit/test_jobscript_unit.py ADDED Viewed

@@ -0,0 +1,757 @@
+import numpy as np
+from hpcflow.app import app as hf
+from hpcflow.sdk.core.test_utils import make_schemas, make_workflow
+from hpcflow.sdk.submission.jobscript import is_jobscript_array, resolve_jobscript_blocks
+import pytest
+def test_resolve_jobscript_blocks():
+    # separate jobscripts due to `is_array`:
+    jobscripts = {
+        0: {"is_array": True, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": True, "resource_hash": 0, "dependencies": {0: "DEP_DATA"}},
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": True, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": True,
+            "blocks": [{"dependencies": {(0, 0): "DEP_DATA"}}],
+        },
+    ]
+    # separate jobscripts due to different `resource_hash`:
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 1, "dependencies": {0: "DEP_DATA"}},
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [{"dependencies": {(0, 0): "DEP_DATA"}}],
+        },
+    ]
+    # separate jobscripts due to `is_array`:
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": True, "resource_hash": 0, "dependencies": {0: "DEP_DATA"}},
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": True,
+            "blocks": [{"dependencies": {(0, 0): "DEP_DATA"}}],
+        },
+    ]
+    # separate jobscripts due to `is_array`:
+    jobscripts = {
+        0: {"is_array": True, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 0, "dependencies": {0: "DEP_DATA"}},
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": True, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [{"dependencies": {(0, 0): "DEP_DATA"}}],
+        },
+    ]
+    # combined jobscript due to same resource_hash, not is_array, and dependencies:
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 0, "dependencies": {0: "DEP_DATA"}},
+        2: {"is_array": False, "resource_hash": 0, "dependencies": {1: "DEP_DATA"}},
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [
+                {"dependencies": {}},
+                {"dependencies": {(0, 0): "DEP_DATA"}},
+                {"dependencies": {(0, 1): "DEP_DATA"}},
+            ],
+        }
+    ]
+    # combined jobscript due to same resource_hash, not is_array, and dependencies:
+    # (checking non-consecutive jobscript index `3` is inconsequential)
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 0, "dependencies": {0: "DEP_DATA"}},
+        3: {"is_array": False, "resource_hash": 0, "dependencies": {1: "DEP_DATA"}},
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [
+                {"dependencies": {}},
+                {"dependencies": {(0, 0): "DEP_DATA"}},
+                {"dependencies": {(0, 1): "DEP_DATA"}},
+            ],
+        }
+    ]
+    # jobscript 0 and 1 combined, not 2 due to independence:
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 0, "dependencies": {0: "DEP_DATA"}},
+        2: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [{"dependencies": {}}, {"dependencies": {(0, 0): "DEP_DATA"}}],
+        },
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+    ]
+    # separate jobscripts 0,1 due to independence, separate jobscript 2 due to dependence
+    # that spans multiple upstream jobscripts that are independent:
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        2: {
+            "is_array": False,
+            "resource_hash": 0,
+            "dependencies": {0: "DEP_DATA", 1: "DEP_DATA"},
+        },
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [{"dependencies": {(0, 0): "DEP_DATA", (1, 0): "DEP_DATA"}}],
+        },
+    ]
+    # combine jobscripts due to dependence
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 0, "dependencies": {0: "DEP_DATA"}},
+        2: {
+            "is_array": False,
+            "resource_hash": 0,
+            "dependencies": {0: "DEP_DATA", 1: "DEP_DATA"},
+        },
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [
+                {"dependencies": {}},
+                {"dependencies": {(0, 0): "DEP_DATA"}},
+                {"dependencies": {(0, 0): "DEP_DATA", (0, 1): "DEP_DATA"}},
+            ],
+        }
+    ]
+    # separate jobscripts 0,1 due to independence, combined jobscripts 3,4 due to shared
+    # dependencies:
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        2: {
+            "is_array": False,
+            "resource_hash": 0,
+            "dependencies": {0: "DEP_DATA", 1: "DEP_DATA"},
+        },
+        3: {
+            "is_array": False,
+            "resource_hash": 0,
+            "dependencies": {0: "DEP_DATA", 1: "DEP_DATA", 2: "DEP_DATA"},
+        },
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [
+                {"dependencies": {(0, 0): "DEP_DATA", (1, 0): "DEP_DATA"}},
+                {
+                    "dependencies": {
+                        (0, 0): "DEP_DATA",
+                        (1, 0): "DEP_DATA",
+                        (2, 0): "DEP_DATA",
+                    }
+                },
+            ],
+        },
+    ]
+    # seperate jobscripts 0,1,2 due to resource hashes, combined 2,3 due to shared
+    # upstream dependencies:
+    jobscripts = {
+        0: {"is_array": False, "resource_hash": 0, "dependencies": {}},
+        1: {"is_array": False, "resource_hash": 1, "dependencies": {0: "DEP_DATA"}},
+        2: {"is_array": False, "resource_hash": 0, "dependencies": {1: "DEP_DATA"}},
+        3: {
+            "is_array": False,
+            "resource_hash": 0,
+            "dependencies": {0: "DEP_DATA", 2: "DEP_DATA"},
+        },
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [{"dependencies": {(0, 0): "DEP_DATA"}}],
+        },
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [
+                {"dependencies": {(1, 0): "DEP_DATA"}},
+                {"dependencies": {(0, 0): "DEP_DATA", (2, 0): "DEP_DATA"}},
+            ],
+        },
+    ]
+    # test non-consecutive jobscript indices (i.e. 0,1 merged across tasks in previous
+    # step); separate jobscripts 0,2,3 due to resource hashes, combined 3,4 due to shared
+    # upstream dependencies:
+    jobscripts = {
+        0: {"resource_hash": 0, "dependencies": {}, "is_array": False},
+        2: {
+            "resource_hash": 1,
+            "dependencies": {0: "DEP_DATA"},
+            "is_array": False,
+        },
+        3: {
+            "resource_hash": 0,
+            "dependencies": {0: "DEP_DATA", 2: "DEP_DATA"},
+            "is_array": False,
+        },
+        4: {
+            "resource_hash": 0,
+            "dependencies": {0: "DEP_DATA", 3: "DEP_DATA"},
+            "is_array": False,
+        },
+    }
+    assert resolve_jobscript_blocks(jobscripts) == [
+        {"resources": None, "is_array": False, "blocks": [{"dependencies": {}}]},
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [{"dependencies": {(0, 0): "DEP_DATA"}}],
+        },
+        {
+            "resources": None,
+            "is_array": False,
+            "blocks": [
+                {"dependencies": {(0, 0): "DEP_DATA", (1, 0): "DEP_DATA"}},
+                {"dependencies": {(0, 0): "DEP_DATA", (2, 0): "DEP_DATA"}},
+            ],
+        },
+    ]
+def test_is_job_array_raises_on_bad_scheduler():
+    resources = hf.ElementResources(use_job_array=True)
+    resources.set_defaults()
+    with pytest.raises(ValueError):
+        is_jobscript_array(resources=resources, num_elements=2, store=None)
+def test_force_array(null_config, tmp_path):
+    wk = make_workflow(
+        [[{"p1": None}, ("p2",), "t1"]],
+        path=tmp_path,
+        local_sequences={0: [("inputs.p1", 2, 0)]},
+        name="w1",
+        overwrite=False,
+    )
+    sub = wk.add_submission(force_array=True)
+    assert len(sub.jobscripts) == 1
+    assert sub.jobscripts[0].is_array
+def test_merge_jobscript_multi_dependence(null_config, tmp_path):
+    s1, s2, s3 = make_schemas(
+        ({}, ("p1", "p2"), "t1"),
+        (
+            {
+                "p1": None,
+            },
+            ("p3",),
+            "t2",
+        ),
+        ({"p1": None, "p3": None}, tuple(), "t3"),
+    )
+    wk = hf.Workflow.from_template_data(
+        template_name="test_merge_js",
+        workflow_name="test_merge_js",
+        overwrite=True,
+        path=tmp_path,
+        tasks=[
+            hf.Task(schema=s1, repeats=2),
+            hf.Task(schema=s2),
+            hf.Task(schema=s3),
+        ],
+    )
+    sub = wk.add_submission()
+    assert len(sub.jobscripts) == 1
+    assert len(sub.jobscripts[0].blocks) == 1
+def test_merge_jobscript_multi_dependence_non_array_source(null_config, tmp_path):
+    # the second two jobscripts should merge
+    s1, s2, s3 = make_schemas(
+        ({}, ("p1", "p2"), "t1"),
+        (
+            {
+                "p1": None,
+            },
+            ("p3",),
+            "t2",
+        ),
+        ({"p1": None, "p3": None}, tuple(), "t3"),
+    )
+    wk = hf.Workflow.from_template_data(
+        template_name="wk_test_merge",
+        path=tmp_path,
+        tasks=[
+            hf.Task(schema=s1),
+            hf.Task(schema=s2, repeats=2),
+            hf.Task(schema=s3),
+        ],
+    )
+    sub = wk.add_submission(force_array=True)
+    assert len(sub.jobscripts) == 2
+    assert len(sub.jobscripts[0].blocks) == 1
+    assert len(sub.jobscripts[1].blocks) == 1
+def test_multi_block_jobscript_multi_dependence(null_config, tmp_path):
+    s1, s2, s3, s4 = make_schemas(
+        ({"p1": None}, ("p2", "p3"), "t1"),
+        ({"p2": None}, ("p4",), "t2"),
+        ({"p4": None}, ("p5",), "t3"),
+        ({"p3": None, "p5": None}, (), "t4"),
+    )
+    tasks = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk = hf.Workflow.from_template_data(
+        template_name="test_js_blocks",
+        workflow_name="test_js_blocks",
+        tasks=tasks,
+        path=tmp_path,
+    )
+    sub = wk.add_submission()
+    assert len(sub.jobscripts) == 1
+    assert len(sub.jobscripts[0].blocks) == 1
+def test_multi_block_jobscript_multi_dependence_distinct_resources(null_config, tmp_path):
+    s1, s2, s3, s4 = make_schemas(
+        ({"p1": None}, ("p2", "p3"), "t1"),
+        ({"p2": None}, ("p4",), "t2"),
+        ({"p4": None}, ("p5",), "t3"),
+        ({"p3": None, "p5": None}, (), "t4"),
+    )
+    tasks = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk = hf.Workflow.from_template_data(
+        template_name="test_js_blocks",
+        workflow_name="test_js_blocks",
+        tasks=tasks,
+        path=tmp_path,
+    )
+    sub = wk.add_submission()
+    assert len(sub.jobscripts) == 3
+    assert len(sub.jobscripts[0].blocks) == 1
+    assert len(sub.jobscripts[1].blocks) == 1
+    assert len(sub.jobscripts[2].blocks) == 2
+def test_multi_block_jobscript_multi_dependence_distinct_resources_sequence_and_group(
+    null_config, tmp_path
+):
+    s1, s2, s3 = make_schemas(
+        ({"p1": None}, ("p2",), "t1"),
+        ({"p2": None}, ("p4",), "t2"),
+        ({"p4": None}, ("p5",), "t3"),
+    )
+    s4 = hf.TaskSchema(
+        objective="t4",
+        inputs=[hf.SchemaInput("p2", group="g1"), hf.SchemaInput("p5", group="g1")],
+        actions=[
+            hf.Action(
+                commands=[
+                    hf.Command("echo $((<<sum(parameter:p2)>> + <<sum(parameter:p5)>>))")
+                ]
+            )
+        ],
+    )
+    tasks = [
+        hf.Task(
+            schema=s1,
+            sequences=[hf.ValueSequence(path="inputs.p1", values=[1, 2])],
+            groups=[hf.ElementGroup(name="g1")],
+        ),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3, groups=[hf.ElementGroup(name="g1")]),
+        hf.Task(schema=s4),
+    ]
+    wk = hf.Workflow.from_template_data(
+        template_name="test_js_blocks",
+        workflow_name="test_js_blocks",
+        tasks=tasks,
+        overwrite=True,
+        path=tmp_path,
+    )
+    sub = wk.add_submission()
+    assert len(sub.jobscripts) == 3
+    assert len(sub.jobscripts[0].blocks) == 1
+    assert len(sub.jobscripts[1].blocks) == 1
+    assert len(sub.jobscripts[2].blocks) == 2
+def test_combine_scripts_unset_False_jobscript_hash_equivalence(null_config, tmp_path):
+    s1 = hf.TaskSchema(
+        objective="t1",
+        actions=[
+            hf.Action(
+                script="<<script:main_script_test_direct_in.py>>",
+                script_data_in="direct",
+                script_data_out="direct",
+                script_exe="python_script",
+                environments=[hf.ActionEnvironment(environment="python_env")],
+            ),
+            hf.Action(commands=[hf.Command(command='echo "hello!"')]),
+        ],
+    )
+    t1 = hf.Task(schema=s1)
+    wk = hf.Workflow.from_template_data(
+        tasks=[t1],
+        resources={
+            "any": {
+                "combine_scripts": False,  # only applies to the Python script action
+            },
+        },
+        template_name="combine_scripts_test",
+        path=tmp_path,
+    )
+    sub = wk.add_submission()
+    # test that even though `combine_scripts` is not set on second action (because it is
+    # not a Python script action), the resources have an equivalent hash and thus only one
+    # jobscript is generated:
+    iter_1 = wk.tasks.t1.elements[0].iterations[0]
+    act_1 = iter_1.action_runs[0].action
+    act_2 = iter_1.action_runs[1].action
+    res_1 = iter_1.get_resources_obj(act_1)
+    res_2 = iter_1.get_resources_obj(act_2)
+    # set to False on first action:
+    assert iter_1.get_resources_obj(act_1).combine_scripts == False
+    # not set on second action:
+    assert iter_1.get_resources_obj(act_2).combine_scripts == None
+    # hashes equivalent:
+    assert res_1.get_jobscript_hash() == res_2.get_jobscript_hash()
+    assert len(sub.jobscripts) == 1
+def test_JS_parallelism_default_zarr(null_config, tmp_path):
+    t1 = hf.Task(
+        schema=hf.task_schemas.test_t1_conditional_OS,
+        inputs={"p1": 100},
+    )
+    wk = hf.Workflow.from_template_data(
+        template_name="test_JS_parallelism_default_set_zarr",
+        path=tmp_path,
+        tasks=[t1],
+        store="zarr",
+    )
+    wk.add_submission()  # do not set JS_parallelism
+    # zarr supports JS parallelism, so by default should be set to "scheduled":
+    assert wk.submissions[0].JS_parallelism == "scheduled"
+def test_JS_parallelism_default_json(null_config, tmp_path):
+    t1 = hf.Task(
+        schema=hf.task_schemas.test_t1_conditional_OS,
+        inputs={"p1": 100},
+    )
+    wk = hf.Workflow.from_template_data(
+        template_name="test_JS_parallelism_default_set_json",
+        path=tmp_path,
+        tasks=[t1],
+        store="json",
+    )
+    wk.add_submission()  # do not set JS_parallelism
+    # json does not support JS parallelism, so by default should be set to False:
+    assert wk.submissions[0].JS_parallelism is False
+def test_jobscript_block_run_IDs_equivalence_JSON_Zarr(null_config, tmp_path):
+    """The zarr store keeps jobscript-block run IDs in separate arrays, so test
+    equivalence."""
+    s1, s2, s3, s4 = make_schemas(
+        ({"p1": None}, ("p2", "p3"), "t1"),
+        ({"p2": None}, ("p4",), "t2"),
+        ({"p4": None}, ("p5",), "t3"),
+        ({"p3": None, "p5": None}, (), "t4"),
+    )
+    tasks_zarr = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_zarr = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_zarr",
+        tasks=tasks_zarr,
+        path=tmp_path,
+        store="zarr",
+    )
+    sub_zarr = wk_zarr.add_submission()
+    tasks_json = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_json = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_json",
+        tasks=tasks_json,
+        path=tmp_path,
+        store="json",
+    )
+    sub_json = wk_json.add_submission()
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        js_json = sub_json.jobscripts[js_idx]
+        assert np.array_equal(js_zarr.all_EAR_IDs, js_json.all_EAR_IDs)
+    # reload both workflows from disk, and check again, since above will check data from
+    # in-memory modified Submission object
+    sub_json = wk_json.reload().submissions[0]
+    sub_zarr = wk_zarr.reload().submissions[0]
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        js_json = sub_json.jobscripts[js_idx]
+        assert np.array_equal(js_zarr.all_EAR_IDs, js_json.all_EAR_IDs)
+def test_jobscript_task_element_maps_equivalence_JSON_Zarr(null_config, tmp_path):
+    """The zarr store keeps jobscript-block task-element maps in separate arrays, so test
+    equivalence."""
+    s1, s2, s3, s4 = make_schemas(
+        ({"p1": None}, ("p2", "p3"), "t1"),
+        ({"p2": None}, ("p4",), "t2"),
+        ({"p4": None}, ("p5",), "t3"),
+        ({"p3": None, "p5": None}, (), "t4"),
+    )
+    tasks_zarr = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_zarr = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_zarr",
+        tasks=tasks_zarr,
+        path=tmp_path,
+        store="zarr",
+    )
+    sub_zarr = wk_zarr.add_submission()
+    tasks_json = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_json = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_json",
+        tasks=tasks_json,
+        path=tmp_path,
+        store="json",
+    )
+    sub_json = wk_json.add_submission()
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        assert len(js_zarr.blocks) == len(sub_json.jobscripts[js_idx].blocks)
+        for blk_idx, js_blk_zarr in enumerate(js_zarr.blocks):
+            js_blk_json = sub_json.jobscripts[js_idx].blocks[blk_idx]
+            assert js_blk_zarr.task_elements == js_blk_json.task_elements
+    # reload both workflows from disk, and check again, since above will check data from
+    # in-memory modified Submission object
+    sub_json = wk_json.reload().submissions[0]
+    sub_zarr = wk_zarr.reload().submissions[0]
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        assert len(js_zarr.blocks) == len(sub_json.jobscripts[js_idx].blocks)
+        for blk_idx, js_blk_zarr in enumerate(js_zarr.blocks):
+            js_blk_json = sub_json.jobscripts[js_idx].blocks[blk_idx]
+            assert js_blk_zarr.task_elements == js_blk_json.task_elements
+def test_jobscript_task_actions_equivalence_JSON_Zarr(null_config, tmp_path):
+    """The zarr store keeps jobscript-block task-actions in separate arrays, so test
+    equivalence."""
+    s1, s2, s3, s4 = make_schemas(
+        ({"p1": None}, ("p2", "p3"), "t1"),
+        ({"p2": None}, ("p4",), "t2"),
+        ({"p4": None}, ("p5",), "t3"),
+        ({"p3": None, "p5": None}, (), "t4"),
+    )
+    tasks_zarr = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_zarr = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_zarr",
+        tasks=tasks_zarr,
+        path=tmp_path,
+        store="zarr",
+    )
+    sub_zarr = wk_zarr.add_submission()
+    tasks_json = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_json = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_json",
+        tasks=tasks_json,
+        path=tmp_path,
+        store="json",
+    )
+    sub_json = wk_json.add_submission()
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        assert len(js_zarr.blocks) == len(sub_json.jobscripts[js_idx].blocks)
+        for blk_idx, js_blk_zarr in enumerate(js_zarr.blocks):
+            js_blk_json = sub_json.jobscripts[js_idx].blocks[blk_idx]
+            assert np.array_equal(js_blk_zarr.task_actions, js_blk_json.task_actions)
+    # reload both workflows from disk, and check again, since above will check data from
+    # in-memory modified Submission object
+    sub_json = wk_json.reload().submissions[0]
+    sub_zarr = wk_zarr.reload().submissions[0]
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        assert len(js_zarr.blocks) == len(sub_json.jobscripts[js_idx].blocks)
+        for blk_idx, js_blk_zarr in enumerate(js_zarr.blocks):
+            js_blk_json = sub_json.jobscripts[js_idx].blocks[blk_idx]
+            assert np.array_equal(js_blk_zarr.task_actions, js_blk_json.task_actions)
+def test_jobscript_dependencies_equivalence_JSON_Zarr(null_config, tmp_path):
+    """The zarr store keeps jobscript-block dependencies in separate arrays, so test
+    equivalence."""
+    s1, s2, s3, s4 = make_schemas(
+        ({"p1": None}, ("p2", "p3"), "t1"),
+        ({"p2": None}, ("p4",), "t2"),
+        ({"p4": None}, ("p5",), "t3"),
+        ({"p3": None, "p5": None}, (), "t4"),
+    )
+    tasks_zarr = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_zarr = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_zarr",
+        tasks=tasks_zarr,
+        path=tmp_path,
+        store="zarr",
+    )
+    sub_zarr = wk_zarr.add_submission()
+    tasks_json = [
+        hf.Task(schema=s1, inputs={"p1": 101}),
+        hf.Task(schema=s2, resources={"any": {"num_cores": 2}}),
+        hf.Task(schema=s3),
+        hf.Task(schema=s4),
+    ]
+    wk_json = hf.Workflow.from_template_data(
+        template_name="test_js_blocks_json",
+        tasks=tasks_json,
+        path=tmp_path,
+        store="json",
+    )
+    sub_json = wk_json.add_submission()
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        assert len(js_zarr.blocks) == len(sub_json.jobscripts[js_idx].blocks)
+        for blk_idx, js_blk_zarr in enumerate(js_zarr.blocks):
+            js_blk_json = sub_json.jobscripts[js_idx].blocks[blk_idx]
+            assert js_blk_zarr.dependencies == js_blk_json.dependencies
+    # reload both workflows from disk, and check again, since above will check data from
+    # in-memory modified Submission object
+    sub_json = wk_json.reload().submissions[0]
+    sub_zarr = wk_zarr.reload().submissions[0]
+    assert len(sub_zarr.jobscripts) == len(sub_json.jobscripts)
+    for js_idx, js_zarr in enumerate(sub_zarr.jobscripts):
+        assert len(js_zarr.blocks) == len(sub_json.jobscripts[js_idx].blocks)
+        for blk_idx, js_blk_zarr in enumerate(js_zarr.blocks):
+            js_blk_json = sub_json.jobscripts[js_idx].blocks[blk_idx]
+            assert js_blk_zarr.dependencies == js_blk_json.dependencies

hpcflow-new2 0.2.0a189__py3-none-any.whl → 0.2.0a199__py3-none-any.whl

hpcflow-new2 0.2.0a189py3-none-any.whl → 0.2.0a199py3-none-any.whl