PyPI - parsl - Versions diffs - 2024.3.18__py3-none-any.whl → 2025.1.13__py3-none-any.whl - Mend

parsl 2024.3.18py3-none-any.whl → 2025.1.13py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (369) hide show

parsl/__init__.py +9 -10
parsl/addresses.py +26 -6
parsl/app/app.py +7 -8
parsl/app/bash.py +15 -8
parsl/app/errors.py +10 -13
parsl/app/futures.py +8 -10
parsl/app/python.py +2 -1
parsl/benchmark/perf.py +2 -1
parsl/concurrent/__init__.py +2 -2
parsl/config.py +53 -10
parsl/configs/ASPIRE1.py +6 -5
parsl/configs/Azure.py +9 -8
parsl/configs/bridges.py +6 -4
parsl/configs/cc_in2p3.py +3 -3
parsl/configs/ec2.py +3 -1
parsl/configs/expanse.py +4 -3
parsl/configs/frontera.py +3 -4
parsl/configs/htex_local.py +3 -4
parsl/configs/illinoiscluster.py +3 -1
parsl/configs/improv.py +34 -0
parsl/configs/kubernetes.py +4 -3
parsl/configs/local_threads.py +5 -1
parsl/configs/midway.py +5 -3
parsl/configs/osg.py +4 -2
parsl/configs/polaris.py +4 -2
parsl/configs/stampede2.py +6 -5
parsl/configs/summit.py +3 -3
parsl/configs/toss3_llnl.py +4 -3
parsl/configs/vineex_local.py +6 -4
parsl/configs/wqex_local.py +5 -3
parsl/curvezmq.py +4 -0
parsl/data_provider/data_manager.py +4 -3
parsl/data_provider/file_noop.py +1 -2
parsl/data_provider/files.py +3 -3
parsl/data_provider/ftp.py +1 -3
parsl/data_provider/globus.py +7 -6
parsl/data_provider/http.py +2 -2
parsl/data_provider/rsync.py +1 -1
parsl/data_provider/staging.py +2 -2
parsl/data_provider/zip.py +135 -0
parsl/dataflow/dependency_resolvers.py +115 -0
parsl/dataflow/dflow.py +259 -223
parsl/dataflow/errors.py +3 -5
parsl/dataflow/futures.py +27 -14
parsl/dataflow/memoization.py +5 -5
parsl/dataflow/rundirs.py +5 -6
parsl/dataflow/taskrecord.py +4 -5
parsl/executors/__init__.py +4 -2
parsl/executors/base.py +45 -15
parsl/executors/errors.py +13 -0
parsl/executors/execute_task.py +37 -0
parsl/executors/flux/execute_parsl_task.py +3 -3
parsl/executors/flux/executor.py +18 -19
parsl/executors/flux/flux_instance_manager.py +26 -27
parsl/executors/high_throughput/errors.py +43 -3
parsl/executors/high_throughput/executor.py +307 -285
parsl/executors/high_throughput/interchange.py +137 -168
parsl/executors/high_throughput/manager_record.py +4 -0
parsl/executors/high_throughput/manager_selector.py +55 -0
parsl/executors/high_throughput/monitoring_info.py +2 -1
parsl/executors/high_throughput/mpi_executor.py +113 -0
parsl/executors/high_throughput/mpi_prefix_composer.py +10 -11
parsl/executors/high_throughput/mpi_resource_management.py +6 -17
parsl/executors/high_throughput/probe.py +9 -7
parsl/executors/high_throughput/process_worker_pool.py +77 -75
parsl/executors/high_throughput/zmq_pipes.py +81 -23
parsl/executors/radical/executor.py +130 -79
parsl/executors/radical/rpex_resources.py +17 -15
parsl/executors/radical/rpex_worker.py +4 -3
parsl/executors/status_handling.py +157 -51
parsl/executors/taskvine/__init__.py +1 -1
parsl/executors/taskvine/errors.py +1 -1
parsl/executors/taskvine/exec_parsl_function.py +2 -2
parsl/executors/taskvine/executor.py +38 -55
parsl/executors/taskvine/factory.py +1 -1
parsl/executors/taskvine/factory_config.py +1 -1
parsl/executors/taskvine/manager.py +17 -13
parsl/executors/taskvine/manager_config.py +7 -2
parsl/executors/threads.py +6 -6
parsl/executors/workqueue/errors.py +1 -1
parsl/executors/workqueue/exec_parsl_function.py +6 -5
parsl/executors/workqueue/executor.py +64 -63
parsl/executors/workqueue/parsl_coprocess.py +1 -1
parsl/jobs/error_handlers.py +2 -2
parsl/jobs/job_status_poller.py +28 -112
parsl/jobs/states.py +7 -2
parsl/jobs/strategy.py +43 -31
parsl/launchers/__init__.py +12 -3
parsl/launchers/errors.py +1 -1
parsl/launchers/launchers.py +0 -6
parsl/log_utils.py +1 -2
parsl/monitoring/db_manager.py +55 -93
parsl/monitoring/errors.py +6 -0
parsl/monitoring/monitoring.py +85 -311
parsl/monitoring/queries/pandas.py +1 -2
parsl/monitoring/radios/base.py +13 -0
parsl/monitoring/radios/filesystem.py +52 -0
parsl/monitoring/radios/htex.py +57 -0
parsl/monitoring/radios/multiprocessing.py +17 -0
parsl/monitoring/radios/udp.py +56 -0
parsl/monitoring/radios/zmq.py +17 -0
parsl/monitoring/remote.py +33 -37
parsl/monitoring/router.py +212 -0
parsl/monitoring/types.py +5 -6
parsl/monitoring/visualization/app.py +4 -2
parsl/monitoring/visualization/models.py +0 -1
parsl/monitoring/visualization/plots/default/workflow_plots.py +8 -4
parsl/monitoring/visualization/plots/default/workflow_resource_plots.py +1 -0
parsl/monitoring/visualization/utils.py +0 -1
parsl/monitoring/visualization/views.py +16 -9
parsl/multiprocessing.py +0 -1
parsl/process_loggers.py +1 -2
parsl/providers/__init__.py +8 -17
parsl/providers/aws/aws.py +2 -3
parsl/providers/azure/azure.py +4 -5
parsl/providers/base.py +2 -18
parsl/providers/cluster_provider.py +3 -9
parsl/providers/condor/condor.py +7 -17
parsl/providers/errors.py +2 -2
parsl/providers/googlecloud/googlecloud.py +2 -1
parsl/providers/grid_engine/grid_engine.py +5 -14
parsl/providers/kubernetes/kube.py +80 -40
parsl/providers/local/local.py +13 -26
parsl/providers/lsf/lsf.py +5 -23
parsl/providers/pbspro/pbspro.py +5 -17
parsl/providers/slurm/slurm.py +81 -39
parsl/providers/torque/torque.py +3 -14
parsl/serialize/__init__.py +8 -3
parsl/serialize/base.py +1 -2
parsl/serialize/concretes.py +5 -4
parsl/serialize/facade.py +3 -3
parsl/serialize/proxystore.py +3 -2
parsl/tests/__init__.py +1 -1
parsl/tests/configs/azure_single_node.py +4 -5
parsl/tests/configs/bridges.py +3 -2
parsl/tests/configs/cc_in2p3.py +1 -3
parsl/tests/configs/comet.py +2 -1
parsl/tests/configs/ec2_single_node.py +1 -2
parsl/tests/configs/ec2_spot.py +1 -2
parsl/tests/configs/flux_local.py +11 -0
parsl/tests/configs/frontera.py +2 -3
parsl/tests/configs/htex_local.py +3 -5
parsl/tests/configs/htex_local_alternate.py +11 -15
parsl/tests/configs/htex_local_intask_staging.py +5 -9
parsl/tests/configs/htex_local_rsync_staging.py +4 -8
parsl/tests/configs/local_radical.py +1 -3
parsl/tests/configs/local_radical_mpi.py +2 -2
parsl/tests/configs/local_threads_checkpoint_periodic.py +8 -10
parsl/tests/configs/local_threads_monitoring.py +0 -1
parsl/tests/configs/midway.py +2 -2
parsl/tests/configs/nscc_singapore.py +3 -3
parsl/tests/configs/osg_htex.py +1 -1
parsl/tests/configs/petrelkube.py +3 -2
parsl/tests/configs/slurm_local.py +24 -0
parsl/tests/configs/summit.py +1 -0
parsl/tests/configs/taskvine_ex.py +4 -7
parsl/tests/configs/user_opts.py +0 -7
parsl/tests/configs/workqueue_ex.py +4 -6
parsl/tests/conftest.py +27 -13
parsl/tests/integration/test_stress/test_python_simple.py +3 -4
parsl/tests/integration/test_stress/test_python_threads.py +3 -5
parsl/tests/manual_tests/htex_local.py +4 -6
parsl/tests/manual_tests/test_basic.py +1 -0
parsl/tests/manual_tests/test_log_filter.py +3 -1
parsl/tests/manual_tests/test_memory_limits.py +6 -8
parsl/tests/manual_tests/test_regression_220.py +2 -1
parsl/tests/manual_tests/test_udp_simple.py +4 -4
parsl/tests/manual_tests/test_worker_count.py +3 -2
parsl/tests/scaling_tests/htex_local.py +2 -4
parsl/tests/scaling_tests/test_scale.py +0 -9
parsl/tests/scaling_tests/vineex_condor.py +1 -2
parsl/tests/scaling_tests/vineex_local.py +1 -2
parsl/tests/site_tests/site_config_selector.py +1 -6
parsl/tests/site_tests/test_provider.py +4 -2
parsl/tests/site_tests/test_site.py +2 -0
parsl/tests/sites/test_affinity.py +7 -7
parsl/tests/sites/test_dynamic_executor.py +3 -4
parsl/tests/sites/test_ec2.py +3 -2
parsl/tests/sites/test_worker_info.py +4 -5
parsl/tests/test_aalst_patterns.py +0 -1
parsl/tests/test_bash_apps/test_apptimeout.py +2 -2
parsl/tests/test_bash_apps/test_basic.py +10 -4
parsl/tests/test_bash_apps/test_error_codes.py +5 -7
parsl/tests/test_bash_apps/test_inputs_default.py +25 -0
parsl/tests/test_bash_apps/test_kwarg_storage.py +1 -1
parsl/tests/test_bash_apps/test_memoize.py +2 -8
parsl/tests/test_bash_apps/test_memoize_ignore_args.py +9 -14
parsl/tests/test_bash_apps/test_memoize_ignore_args_regr.py +9 -14
parsl/tests/test_bash_apps/test_multiline.py +1 -1
parsl/tests/test_bash_apps/test_pipeline.py +1 -1
parsl/tests/test_bash_apps/test_std_uri.py +123 -0
parsl/tests/test_bash_apps/test_stdout.py +33 -8
parsl/tests/test_callables.py +2 -2
parsl/tests/test_checkpointing/test_periodic.py +21 -39
parsl/tests/test_checkpointing/test_python_checkpoint_1.py +1 -0
parsl/tests/test_checkpointing/test_python_checkpoint_2.py +2 -2
parsl/tests/test_checkpointing/test_python_checkpoint_3.py +0 -1
parsl/tests/test_checkpointing/test_regression_239.py +1 -1
parsl/tests/test_checkpointing/test_task_exit.py +2 -3
parsl/tests/test_docs/test_from_slides.py +5 -2
parsl/tests/test_docs/test_kwargs.py +4 -1
parsl/tests/test_docs/test_tutorial_1.py +1 -2
parsl/tests/test_docs/test_workflow1.py +2 -2
parsl/tests/test_docs/test_workflow2.py +0 -1
parsl/tests/test_error_handling/test_rand_fail.py +2 -2
parsl/tests/test_error_handling/test_resource_spec.py +10 -12
parsl/tests/test_error_handling/test_retries.py +6 -16
parsl/tests/test_error_handling/test_retry_handler.py +1 -0
parsl/tests/test_error_handling/test_retry_handler_failure.py +2 -1
parsl/tests/test_error_handling/test_serialization_fail.py +1 -1
parsl/tests/test_error_handling/test_wrap_with_logs.py +1 -0
parsl/tests/test_execute_task.py +29 -0
parsl/tests/test_flux.py +1 -1
parsl/tests/test_htex/test_basic.py +2 -3
parsl/tests/test_htex/test_block_manager_selector_unit.py +20 -0
parsl/tests/test_htex/test_command_client_timeout.py +66 -0
parsl/tests/test_htex/test_connected_blocks.py +3 -2
parsl/tests/test_htex/test_cpu_affinity_explicit.py +6 -10
parsl/tests/test_htex/test_disconnected_blocks.py +6 -5
parsl/tests/test_htex/test_disconnected_blocks_failing_provider.py +71 -0
parsl/tests/test_htex/test_drain.py +11 -10
parsl/tests/test_htex/test_htex.py +51 -25
parsl/tests/test_htex/test_manager_failure.py +0 -1
parsl/tests/test_htex/test_manager_selector_by_block.py +51 -0
parsl/tests/test_htex/test_managers_command.py +36 -0
parsl/tests/test_htex/test_missing_worker.py +2 -12
parsl/tests/test_htex/test_multiple_disconnected_blocks.py +9 -9
parsl/tests/test_htex/test_resource_spec_validation.py +45 -0
parsl/tests/test_htex/test_zmq_binding.py +29 -8
parsl/tests/test_monitoring/test_app_names.py +5 -5
parsl/tests/test_monitoring/test_basic.py +73 -25
parsl/tests/test_monitoring/test_db_locks.py +6 -4
parsl/tests/test_monitoring/test_fuzz_zmq.py +19 -8
parsl/tests/test_monitoring/test_htex_init_blocks_vs_monitoring.py +80 -0
parsl/tests/test_monitoring/test_incomplete_futures.py +5 -4
parsl/tests/test_monitoring/test_memoization_representation.py +4 -2
parsl/tests/test_monitoring/test_stdouterr.py +134 -0
parsl/tests/test_monitoring/test_viz_colouring.py +1 -0
parsl/tests/test_mpi_apps/test_bad_mpi_config.py +33 -26
parsl/tests/test_mpi_apps/test_mpi_mode_enabled.py +28 -11
parsl/tests/test_mpi_apps/test_mpi_prefix.py +4 -4
parsl/tests/test_mpi_apps/test_mpi_scheduler.py +7 -2
parsl/tests/test_mpi_apps/test_mpiex.py +64 -0
parsl/tests/test_mpi_apps/test_resource_spec.py +42 -49
parsl/tests/test_providers/test_kubernetes_provider.py +102 -0
parsl/tests/test_providers/test_local_provider.py +3 -132
parsl/tests/test_providers/test_pbspro_template.py +2 -3
parsl/tests/test_providers/test_slurm_template.py +2 -3
parsl/tests/test_providers/test_submiterror_deprecation.py +2 -1
parsl/tests/test_python_apps/test_context_manager.py +128 -0
parsl/tests/test_python_apps/test_dep_standard_futures.py +2 -1
parsl/tests/test_python_apps/test_dependencies_deep.py +59 -0
parsl/tests/test_python_apps/test_fail.py +0 -25
parsl/tests/test_python_apps/test_futures.py +2 -1
parsl/tests/test_python_apps/test_inputs_default.py +22 -0
parsl/tests/test_python_apps/test_join.py +0 -1
parsl/tests/test_python_apps/test_lifted.py +11 -7
parsl/tests/test_python_apps/test_memoize_bad_id_for_memo.py +1 -0
parsl/tests/test_python_apps/test_outputs.py +1 -1
parsl/tests/test_python_apps/test_pluggable_future_resolution.py +161 -0
parsl/tests/test_radical/test_mpi_funcs.py +1 -2
parsl/tests/test_regression/test_1480.py +2 -1
parsl/tests/test_regression/test_1653.py +2 -1
parsl/tests/test_regression/test_226.py +1 -0
parsl/tests/test_regression/test_2652.py +1 -0
parsl/tests/test_regression/test_69a.py +0 -1
parsl/tests/test_regression/test_854.py +4 -2
parsl/tests/test_regression/test_97_parallelism_0.py +1 -2
parsl/tests/test_regression/test_98.py +0 -1
parsl/tests/test_scaling/test_block_error_handler.py +9 -4
parsl/tests/test_scaling/test_regression_1621.py +11 -15
parsl/tests/test_scaling/test_regression_3568_scaledown_vs_MISSING.py +84 -0
parsl/tests/test_scaling/test_regression_3696_oscillation.py +103 -0
parsl/tests/test_scaling/test_scale_down.py +2 -5
parsl/tests/test_scaling/test_scale_down_htex_auto_scale.py +5 -8
parsl/tests/test_scaling/test_scale_down_htex_unregistered.py +71 -0
parsl/tests/test_scaling/test_shutdown_scalein.py +73 -0
parsl/tests/test_scaling/test_worker_interchange_bad_messages_3262.py +90 -0
parsl/tests/test_serialization/test_2555_caching_deserializer.py +1 -1
parsl/tests/test_serialization/test_3495_deserialize_managerlost.py +47 -0
parsl/tests/test_serialization/test_basic.py +2 -1
parsl/tests/test_serialization/test_htex_code_cache.py +3 -4
parsl/tests/test_serialization/test_pack_resource_spec.py +2 -1
parsl/tests/test_serialization/test_proxystore_configured.py +10 -6
parsl/tests/test_serialization/test_proxystore_impl.py +5 -3
parsl/tests/test_shutdown/test_kill_monitoring.py +64 -0
parsl/tests/test_staging/staging_provider.py +2 -2
parsl/tests/test_staging/test_1316.py +3 -4
parsl/tests/test_staging/test_docs_1.py +2 -1
parsl/tests/test_staging/test_docs_2.py +2 -1
parsl/tests/test_staging/test_elaborate_noop_file.py +2 -3
parsl/tests/{test_data → test_staging}/test_file.py +6 -6
parsl/tests/{test_data → test_staging}/test_output_chain_filenames.py +3 -0
parsl/tests/test_staging/test_staging_ftp.py +1 -0
parsl/tests/test_staging/test_staging_https.py +5 -2
parsl/tests/test_staging/test_staging_stdout.py +64 -0
parsl/tests/test_staging/test_zip_in.py +39 -0
parsl/tests/test_staging/test_zip_out.py +110 -0
parsl/tests/test_staging/test_zip_to_zip.py +41 -0
parsl/tests/test_summary.py +2 -2
parsl/tests/test_thread_parallelism.py +0 -1
parsl/tests/test_threads/test_configs.py +1 -2
parsl/tests/test_threads/test_lazy_errors.py +2 -2
parsl/tests/test_utils/test_execute_wait.py +35 -0
parsl/tests/test_utils/test_sanitize_dns.py +76 -0
parsl/tests/unit/test_address.py +20 -0
parsl/tests/unit/test_file.py +99 -0
parsl/tests/unit/test_usage_tracking.py +66 -0
parsl/usage_tracking/api.py +65 -0
parsl/usage_tracking/levels.py +6 -0
parsl/usage_tracking/usage.py +104 -62
parsl/utils.py +137 -4
parsl/version.py +1 -1
{parsl-2024.3.18.data → parsl-2025.1.13.data}/scripts/exec_parsl_function.py +6 -5
parsl-2025.1.13.data/scripts/interchange.py +649 -0
{parsl-2024.3.18.data → parsl-2025.1.13.data}/scripts/process_worker_pool.py +77 -75
parsl-2025.1.13.dist-info/METADATA +96 -0
parsl-2025.1.13.dist-info/RECORD +462 -0
{parsl-2024.3.18.dist-info → parsl-2025.1.13.dist-info}/WHEEL +1 -1
parsl/channels/__init__.py +0 -7
parsl/channels/base.py +0 -141
parsl/channels/errors.py +0 -113
parsl/channels/local/local.py +0 -164
parsl/channels/oauth_ssh/oauth_ssh.py +0 -110
parsl/channels/ssh/ssh.py +0 -276
parsl/channels/ssh_il/__init__.py +0 -0
parsl/channels/ssh_il/ssh_il.py +0 -74
parsl/configs/ad_hoc.py +0 -35
parsl/executors/radical/rpex_master.py +0 -42
parsl/monitoring/radios.py +0 -175
parsl/providers/ad_hoc/__init__.py +0 -0
parsl/providers/ad_hoc/ad_hoc.py +0 -248
parsl/providers/cobalt/__init__.py +0 -0
parsl/providers/cobalt/cobalt.py +0 -236
parsl/providers/cobalt/template.py +0 -17
parsl/tests/configs/ad_hoc_cluster_htex.py +0 -35
parsl/tests/configs/cooley_htex.py +0 -37
parsl/tests/configs/htex_ad_hoc_cluster.py +0 -28
parsl/tests/configs/local_adhoc.py +0 -18
parsl/tests/configs/swan_htex.py +0 -43
parsl/tests/configs/theta.py +0 -37
parsl/tests/integration/test_channels/__init__.py +0 -0
parsl/tests/integration/test_channels/test_channels.py +0 -17
parsl/tests/integration/test_channels/test_local_channel.py +0 -42
parsl/tests/integration/test_channels/test_scp_1.py +0 -45
parsl/tests/integration/test_channels/test_ssh_1.py +0 -40
parsl/tests/integration/test_channels/test_ssh_errors.py +0 -46
parsl/tests/integration/test_channels/test_ssh_file_transport.py +0 -41
parsl/tests/integration/test_channels/test_ssh_interactive.py +0 -24
parsl/tests/manual_tests/test_ad_hoc_htex.py +0 -48
parsl/tests/manual_tests/test_fan_in_out_htex_remote.py +0 -88
parsl/tests/manual_tests/test_oauth_ssh.py +0 -13
parsl/tests/sites/test_local_adhoc.py +0 -61
parsl/tests/test_channels/__init__.py +0 -0
parsl/tests/test_channels/test_large_output.py +0 -22
parsl/tests/test_data/__init__.py +0 -0
parsl/tests/test_mpi_apps/test_mpi_mode_disabled.py +0 -51
parsl/tests/test_providers/test_cobalt_deprecation_warning.py +0 -16
parsl-2024.3.18.dist-info/METADATA +0 -98
parsl-2024.3.18.dist-info/RECORD +0 -449
parsl/{channels/local → monitoring/radios}/__init__.py +0 -0
parsl/{channels/oauth_ssh → tests/test_shutdown}/__init__.py +0 -0
parsl/tests/{test_data → test_staging}/test_file_apps.py +0 -0
parsl/tests/{test_data → test_staging}/test_file_staging.py +0 -0
parsl/{channels/ssh → tests/unit}/__init__.py +0 -0
{parsl-2024.3.18.data → parsl-2025.1.13.data}/scripts/parsl_coprocess.py +1 -1
{parsl-2024.3.18.dist-info → parsl-2025.1.13.dist-info}/LICENSE +0 -0
{parsl-2024.3.18.dist-info → parsl-2025.1.13.dist-info}/entry_points.txt +0 -0
{parsl-2024.3.18.dist-info → parsl-2025.1.13.dist-info}/top_level.txt +0 -0

parsl/dataflow/dflow.py CHANGED Viewed

@@ -1,50 +1,54 @@
 from __future__ import annotations
 import atexit
+import concurrent.futures as cf
+import datetime
+import inspect
 import logging
 import os
-import pathlib
 import pickle
 import random
-import time
-import typeguard
-import inspect
-import threading
 import sys
-import datetime
+import threading
+import time
+from concurrent.futures import Future
+from functools import partial
 from getpass import getuser
-from typeguard import typechecked
+from socket import gethostname
 from typing import Any, Callable, Dict, List, Optional, Sequence, Tuple, Union
 from uuid import uuid4
-from socket import gethostname
-from concurrent.futures import Future
-from functools import partial
+import typeguard
+from typeguard import typechecked
 import parsl
 from parsl.app.errors import RemoteExceptionWrapper
 from parsl.app.futures import DataFuture
-from parsl.channels import Channel
 from parsl.config import Config
 from parsl.data_provider.data_manager import DataManager
 from parsl.data_provider.files import File
+from parsl.dataflow.dependency_resolvers import SHALLOW_DEPENDENCY_RESOLVER
 from parsl.dataflow.errors import BadCheckpoint, DependencyError, JoinError
 from parsl.dataflow.futures import AppFuture
 from parsl.dataflow.memoization import Memoizer
 from parsl.dataflow.rundirs import make_rundir
-from parsl.dataflow.states import States, FINAL_STATES, FINAL_FAILURE_STATES
+from parsl.dataflow.states import FINAL_FAILURE_STATES, FINAL_STATES, States
 from parsl.dataflow.taskrecord import TaskRecord
-from parsl.errors import ConfigurationError, InternalConsistencyError, NoDataFlowKernelError
-from parsl.jobs.job_status_poller import JobStatusPoller
-from parsl.jobs.states import JobStatus, JobState
-from parsl.usage_tracking.usage import UsageTracker
+from parsl.errors import (
+    ConfigurationError,
+    InternalConsistencyError,
+    NoDataFlowKernelError,
+)
 from parsl.executors.base import ParslExecutor
 from parsl.executors.status_handling import BlockProviderExecutor
 from parsl.executors.threads import ThreadPoolExecutor
+from parsl.jobs.job_status_poller import JobStatusPoller
 from parsl.monitoring import MonitoringHub
-from parsl.process_loggers import wrap_with_logs
-from parsl.providers.base import ExecutionProvider
-from parsl.utils import get_version, get_std_fname_mode, get_all_checkpoints, Timer
 from parsl.monitoring.message_type import MessageType
+from parsl.monitoring.remote import monitor_wrapper
+from parsl.process_loggers import wrap_with_logs
+from parsl.usage_tracking.usage import UsageTracker
+from parsl.utils import Timer, get_all_checkpoints, get_std_fname_mode, get_version
 logger = logging.getLogger(__name__)
@@ -106,14 +110,8 @@ class DataFlowKernel:
         self.monitoring: Optional[MonitoringHub]
         self.monitoring = config.monitoring
-        # hub address and port for interchange to connect
-        self.hub_address = None  # type: Optional[str]
-        self.hub_interchange_port = None  # type: Optional[int]
         if self.monitoring:
-            if self.monitoring.logdir is None:
-                self.monitoring.logdir = self.run_dir
-            self.hub_address = self.monitoring.hub_address
-            self.hub_interchange_port = self.monitoring.start(self.run_id, self.run_dir, self.config.run_dir)
+            self.monitoring.start(self.run_dir, self.config.run_dir)
         self.time_began = datetime.datetime.now()
         self.time_completed: Optional[datetime.datetime] = None
@@ -159,8 +157,8 @@ class DataFlowKernel:
         }
         if self.monitoring:
-            self.monitoring.send(MessageType.WORKFLOW_INFO,
-                                 workflow_info)
+            self.monitoring.send((MessageType.WORKFLOW_INFO,
+                                 workflow_info))
         if config.checkpoint_files is not None:
             checkpoints = self.load_checkpoints(config.checkpoint_files)
@@ -179,8 +177,7 @@ class DataFlowKernel:
         # job_status_poller.add_executors.
         self.job_status_poller = JobStatusPoller(strategy=self.config.strategy,
                                                  strategy_period=self.config.strategy_period,
-                                                 max_idletime=self.config.max_idletime,
-                                                 dfk=self)
+                                                 max_idletime=self.config.max_idletime)
         self.executors: Dict[str, ParslExecutor] = {}
@@ -204,21 +201,52 @@ class DataFlowKernel:
         self.tasks: Dict[int, TaskRecord] = {}
         self.submitter_lock = threading.Lock()
+        self.dependency_launch_pool = cf.ThreadPoolExecutor(max_workers=1, thread_name_prefix="Dependency-Launch")
+        self.dependency_resolver = self.config.dependency_resolver if self.config.dependency_resolver is not None \
+            else SHALLOW_DEPENDENCY_RESOLVER
         atexit.register(self.atexit_cleanup)
+    def __enter__(self):
+        return self
+    def __exit__(self, exc_type, exc_value, traceback) -> None:
+        mode = self.config.exit_mode
+        logger.debug("Exiting context manager, with exit mode '%s'", mode)
+        if mode == "cleanup":
+            logger.info("Calling cleanup for DFK")
+            self.cleanup()
+        elif mode == "skip":
+            logger.info("Skipping all cleanup handling")
+        elif mode == "wait":
+            if exc_type is None:
+                logger.info("Waiting for all tasks to complete")
+                self.wait_for_current_tasks()
+                self.cleanup()
+            else:
+                logger.info("There was an exception - cleaning up without waiting for task completion")
+                self.cleanup()
+        else:
+            raise InternalConsistencyError(f"Exit case for {mode} should be unreachable, validated by typeguard on Config()")
     def _send_task_log_info(self, task_record: TaskRecord) -> None:
         if self.monitoring:
             task_log_info = self._create_task_log_info(task_record)
-            self.monitoring.send(MessageType.TASK_INFO, task_log_info)
+            self.monitoring.send((MessageType.TASK_INFO, task_log_info))
-    def _create_task_log_info(self, task_record):
+    def _create_task_log_info(self, task_record: TaskRecord) -> Dict[str, Any]:
         """
         Create the dictionary that will be included in the log.
         """
         info_to_monitor = ['func_name', 'memoize', 'hashsum', 'fail_count', 'fail_cost', 'status',
                            'id', 'time_invoked', 'try_time_launched', 'time_returned', 'try_time_returned', 'executor']
-        task_log_info = {"task_" + k: task_record[k] for k in info_to_monitor}
+        # mypy cannot verify that these task_record[k] references are valid:
+        # They are valid if all entries in info_to_monitor are declared in the definition of TaskRecord
+        # This type: ignore[literal-required] asserts that fact.
+        task_log_info = {"task_" + k: task_record[k] for k in info_to_monitor}  # type: ignore[literal-required]
         task_log_info['run_id'] = self.run_id
         task_log_info['try_id'] = task_record['try_id']
         task_log_info['timestamp'] = datetime.datetime.now()
@@ -230,20 +258,28 @@ class DataFlowKernel:
         task_log_info['task_inputs'] = str(task_record['kwargs'].get('inputs', None))
         task_log_info['task_outputs'] = str(task_record['kwargs'].get('outputs', None))
         task_log_info['task_stdin'] = task_record['kwargs'].get('stdin', None)
-        stdout_spec = task_record['kwargs'].get('stdout', None)
-        stderr_spec = task_record['kwargs'].get('stderr', None)
-        try:
-            stdout_name, _ = get_std_fname_mode('stdout', stdout_spec)
-        except Exception as e:
-            logger.warning("Incorrect stdout format {} for Task {}".format(stdout_spec, task_record['id']))
-            stdout_name = str(e)
-        try:
-            stderr_name, _ = get_std_fname_mode('stderr', stderr_spec)
-        except Exception as e:
-            logger.warning("Incorrect stderr format {} for Task {}".format(stderr_spec, task_record['id']))
-            stderr_name = str(e)
-        task_log_info['task_stdout'] = stdout_name
-        task_log_info['task_stderr'] = stderr_name
+        def std_spec_to_name(name, spec):
+            if spec is None:
+                name = ""
+            elif isinstance(spec, File):
+                name = spec.url
+            else:
+                # fallthrough case is various str, os.PathLike, tuple modes that
+                # can be interpreted by get_std_fname_mode.
+                try:
+                    name, _ = get_std_fname_mode(name, spec)
+                except Exception:
+                    logger.exception(f"Could not parse {name} specification {spec} for task {task_record['id']}")
+                    name = ""
+            return name
+        stdout_spec = task_record['kwargs'].get('stdout')
+        task_log_info['task_stdout'] = std_spec_to_name('stdout', stdout_spec)
+        stderr_spec = task_record['kwargs'].get('stderr')
+        task_log_info['task_stderr'] = std_spec_to_name('stderr', stderr_spec)
         task_log_info['task_fail_history'] = ",".join(task_record['fail_history'])
         task_log_info['task_depends'] = None
         if task_record['depends'] is not None:
@@ -584,9 +620,9 @@ class DataFlowKernel:
         return kwargs.get('_parsl_staging_inhibit', False)
     def launch_if_ready(self, task_record: TaskRecord) -> None:
-        """
-        launch_if_ready will launch the specified task, if it is ready
-        to run (for example, without dependencies, and in pending state).
+        """Schedules a task record for re-inspection to see if it is ready
+        for launch and for launch if it is ready. The call will return
+        immediately.
         This should be called by any piece of the DataFlowKernel that
         thinks a task may have become ready to run.
@@ -595,13 +631,17 @@ class DataFlowKernel:
         ready to run - launch_if_ready will not incorrectly launch that
         task.
-        It is also not an error to call launch_if_ready on a task that has
-        already been launched - launch_if_ready will not re-launch that
-        task.
         launch_if_ready is thread safe, so may be called from any thread
         or callback.
         """
+        self.dependency_launch_pool.submit(self._launch_if_ready_async, task_record)
+    @wrap_with_logs
+    def _launch_if_ready_async(self, task_record: TaskRecord) -> None:
+        """
+        _launch_if_ready will launch the specified task, if it is ready
+        to run (for example, without dependencies, and in pending state).
+        """
         exec_fu = None
         task_id = task_record['id']
@@ -667,14 +707,6 @@ class DataFlowKernel:
     def launch_task(self, task_record: TaskRecord) -> Future:
         """Handle the actual submission of the task to the executor layer.
-        If the app task has the executors attributes not set (default=='all')
-        the task is launched on a randomly selected executor from the
-        list of executors. This behavior could later be updated to support
-        binding to executors based on user specified criteria.
-        If the app task specifies a particular set of executors, it will be
-        targeted at those specific executors.
         Args:
             task_record : The task record
@@ -707,14 +739,18 @@ class DataFlowKernel:
         if self.monitoring is not None and self.monitoring.resource_monitoring_enabled:
             wrapper_logging_level = logging.DEBUG if self.monitoring.monitoring_debug else logging.INFO
-            (function, args, kwargs) = self.monitoring.monitor_wrapper(function, args, kwargs, try_id, task_id,
-                                                                       self.monitoring.monitoring_hub_url,
-                                                                       self.run_id,
-                                                                       wrapper_logging_level,
-                                                                       self.monitoring.resource_monitoring_interval,
-                                                                       executor.radio_mode,
-                                                                       executor.monitor_resources(),
-                                                                       self.run_dir)
+            (function, args, kwargs) = monitor_wrapper(f=function,
+                                                       args=args,
+                                                       kwargs=kwargs,
+                                                       x_try_id=try_id,
+                                                       x_task_id=task_id,
+                                                       monitoring_hub_url=self.monitoring.monitoring_hub_url,
+                                                       run_id=self.run_id,
+                                                       logging_level=wrapper_logging_level,
+                                                       sleep_dur=self.monitoring.resource_monitoring_interval,
+                                                       radio_mode=executor.radio_mode,
+                                                       monitor_resources=executor.monitor_resources(),
+                                                       run_dir=self.run_dir)
         with self.submitter_lock:
             exec_fu = executor.submit(function, task_record['resource_specification'], *args, **kwargs)
@@ -757,6 +793,10 @@ class DataFlowKernel:
             (inputs[idx], func) = self.data_manager.optionally_stage_in(f, func, executor)
         for kwarg, f in kwargs.items():
+            # stdout and stderr files should not be staging in (they will be staged *out*
+            # in _add_output_deps)
+            if kwarg in ['stdout', 'stderr']:
+                continue
             (kwargs[kwarg], func) = self.data_manager.optionally_stage_in(f, func, executor)
         newargs = list(args)
@@ -769,33 +809,55 @@ class DataFlowKernel:
         logger.debug("Adding output dependencies")
         outputs = kwargs.get('outputs', [])
         app_fut._outputs = []
-        for idx, f in enumerate(outputs):
-            if isinstance(f, File) and not self.check_staging_inhibited(kwargs):
+        # Pass over all possible outputs: the outputs kwarg, stdout and stderr
+        # and for each of those, perform possible stage-out. This can result in:
+        # a DataFuture to be exposed in app_fut to represent the completion of
+        # that stageout (sometimes backed by a new sub-workflow for separate-task
+        # stageout), a replacement for the function to be executed (intended to
+        # be the original function wrapped with an in-task stageout wrapper), a
+        # rewritten File object to be passed to task to be executed
+        def stageout_one_file(file: File, rewritable_func: Callable):
+            if not self.check_staging_inhibited(kwargs):
                 # replace a File with a DataFuture - either completing when the stageout
                 # future completes, or if no stage out future is returned, then when the
                 # app itself completes.
                 # The staging code will get a clean copy which it is allowed to mutate,
                 # while the DataFuture-contained original will not be modified by any staging.
-                f_copy = f.cleancopy()
-                outputs[idx] = f_copy
+                f_copy = file.cleancopy()
-                logger.debug("Submitting stage out for output file {}".format(repr(f)))
+                logger.debug("Submitting stage out for output file {}".format(repr(file)))
                 stageout_fut = self.data_manager.stage_out(f_copy, executor, app_fut)
                 if stageout_fut:
-                    logger.debug("Adding a dependency on stageout future for {}".format(repr(f)))
-                    app_fut._outputs.append(DataFuture(stageout_fut, f, tid=app_fut.tid))
+                    logger.debug("Adding a dependency on stageout future for {}".format(repr(file)))
+                    df = DataFuture(stageout_fut, file, tid=app_fut.tid)
                 else:
-                    logger.debug("No stageout dependency for {}".format(repr(f)))
-                    app_fut._outputs.append(DataFuture(app_fut, f, tid=app_fut.tid))
+                    logger.debug("No stageout dependency for {}".format(repr(file)))
+                    df = DataFuture(app_fut, file, tid=app_fut.tid)
                 # this is a hook for post-task stageout
                 # note that nothing depends on the output - which is maybe a bug
                 # in the not-very-tested stageout system?
-                func = self.data_manager.replace_task_stage_out(f_copy, func, executor)
+                rewritable_func = self.data_manager.replace_task_stage_out(f_copy, rewritable_func, executor)
+                return rewritable_func, f_copy, df
             else:
-                logger.debug("Not performing output staging for: {}".format(repr(f)))
-                app_fut._outputs.append(DataFuture(app_fut, f, tid=app_fut.tid))
+                logger.debug("Not performing output staging for: {}".format(repr(file)))
+                return rewritable_func, file, DataFuture(app_fut, file, tid=app_fut.tid)
+        for idx, file in enumerate(outputs):
+            func, outputs[idx], o = stageout_one_file(file, func)
+            app_fut._outputs.append(o)
+        file = kwargs.get('stdout')
+        if isinstance(file, File):
+            func, kwargs['stdout'], app_fut._stdout_future = stageout_one_file(file, func)
+        file = kwargs.get('stderr')
+        if isinstance(file, File):
+            func, kwargs['stderr'], app_fut._stderr_future = stageout_one_file(file, func)
         return func
     def _gather_all_deps(self, args: Sequence[Any], kwargs: Dict[str, Any]) -> List[Future]:
@@ -812,8 +874,11 @@ class DataFlowKernel:
         depends: List[Future] = []
         def check_dep(d: Any) -> None:
-            if isinstance(d, Future):
-                depends.extend([d])
+            try:
+                depends.extend(self.dependency_resolver.traverse_to_gather(d))
+            except Exception:
+                logger.exception("Exception in dependency_resolver.traverse_to_gather")
+                raise
         # Check the positional args
         for dep in args:
@@ -830,7 +895,8 @@ class DataFlowKernel:
         return depends
-    def _unwrap_futures(self, args, kwargs):
+    def _unwrap_futures(self, args: Sequence[Any], kwargs: Dict[str, Any]) \
+            -> Tuple[Sequence[Any], Dict[str, Any], Sequence[Tuple[Exception, str]]]:
         """This function should be called when all dependencies have completed.
         It will rewrite the arguments for that task, replacing each Future
@@ -851,53 +917,40 @@ class DataFlowKernel:
         """
         dep_failures = []
+        def append_failure(e: Exception, dep: Future) -> None:
+            # If this Future is associated with a task inside this DFK,
+            # then refer to the task ID.
+            # Otherwise make a repr of the Future object.
+            if hasattr(dep, 'task_record') and dep.task_record['dfk'] == self:
+                tid = "task " + repr(dep.task_record['id'])
+            else:
+                tid = repr(dep)
+            dep_failures.extend([(e, tid)])
         # Replace item in args
         new_args = []
         for dep in args:
-            if isinstance(dep, Future):
-                try:
-                    new_args.extend([dep.result()])
-                except Exception as e:
-                    # If this Future is associated with a task inside this DFK,
-                    # then refer to the task ID.
-                    # Otherwise make a repr of the Future object.
-                    if hasattr(dep, 'task_record') and dep.task_record['dfk'] == self:
-                        tid = "task " + repr(dep.task_record['id'])
-                    else:
-                        tid = repr(dep)
-                    dep_failures.extend([(e, tid)])
-            else:
-                new_args.extend([dep])
+            try:
+                new_args.extend([self.dependency_resolver.traverse_to_unwrap(dep)])
+            except Exception as e:
+                append_failure(e, dep)
         # Check for explicit kwargs ex, fu_1=<fut>
         for key in kwargs:
             dep = kwargs[key]
-            if isinstance(dep, Future):
-                try:
-                    kwargs[key] = dep.result()
-                except Exception as e:
-                    if hasattr(dep, 'task_record'):
-                        tid = dep.task_record['id']
-                    else:
-                        tid = None
-                    dep_failures.extend([(e, tid)])
+            try:
+                kwargs[key] = self.dependency_resolver.traverse_to_unwrap(dep)
+            except Exception as e:
+                append_failure(e, dep)
         # Check for futures in inputs=[<fut>...]
         if 'inputs' in kwargs:
             new_inputs = []
             for dep in kwargs['inputs']:
-                if isinstance(dep, Future):
-                    try:
-                        new_inputs.extend([dep.result()])
-                    except Exception as e:
-                        if hasattr(dep, 'task_record'):
-                            tid = dep.task_record['id']
-                        else:
-                            tid = None
-                        dep_failures.extend([(e, tid)])
-                else:
-                    new_inputs.extend([dep])
+                try:
+                    new_inputs.extend([self.dependency_resolver.traverse_to_unwrap(dep)])
+                except Exception as e:
+                    append_failure(e, dep)
             kwargs['inputs'] = new_inputs
         return new_args, kwargs, dep_failures
@@ -929,7 +982,7 @@ class DataFlowKernel:
             - app_kwargs (dict) : Rest of the kwargs to the fn passed as dict.
         Returns:
-               (AppFuture) [DataFutures,]
+            AppFuture
         """
@@ -953,32 +1006,16 @@ class DataFlowKernel:
         executor = random.choice(choices)
         logger.debug("Task {} will be sent to executor {}".format(task_id, executor))
-        # The below uses func.__name__ before it has been wrapped by any staging code.
-        label = app_kwargs.get('label')
-        for kw in ['stdout', 'stderr']:
-            if kw in app_kwargs:
-                if app_kwargs[kw] == parsl.AUTO_LOGNAME:
-                    if kw not in ignore_for_cache:
-                        ignore_for_cache += [kw]
-                    app_kwargs[kw] = os.path.join(
-                                self.run_dir,
-                                'task_logs',
-                                str(int(task_id / 10000)).zfill(4),  # limit logs to 10k entries per directory
-                                'task_{}_{}{}.{}'.format(
-                                    str(task_id).zfill(4),
-                                    func.__name__,
-                                    '' if label is None else '_{}'.format(label),
-                                    kw)
-                    )
         resource_specification = app_kwargs.get('parsl_resource_specification', {})
         task_record: TaskRecord
-        task_record = {'depends': [],
+        task_record = {'args': app_args,
+                       'depends': [],
                        'dfk': self,
                        'executor': executor,
+                       'func': func,
                        'func_name': func.__name__,
+                       'kwargs': app_kwargs,
                        'memoize': cache,
                        'hashsum': None,
                        'exec_fu': None,
@@ -1000,25 +1037,41 @@ class DataFlowKernel:
         self.update_task_state(task_record, States.unsched)
+        for kw in ['stdout', 'stderr']:
+            if kw in app_kwargs:
+                if app_kwargs[kw] == parsl.AUTO_LOGNAME:
+                    if kw not in ignore_for_cache:
+                        ignore_for_cache += [kw]
+                    if self.config.std_autopath is None:
+                        app_kwargs[kw] = self.default_std_autopath(task_record, kw)
+                    else:
+                        app_kwargs[kw] = self.config.std_autopath(task_record, kw)
         app_fu = AppFuture(task_record)
+        task_record['app_fu'] = app_fu
         # Transform remote input files to data futures
         app_args, app_kwargs, func = self._add_input_deps(executor, app_args, app_kwargs, func)
         func = self._add_output_deps(executor, app_args, app_kwargs, app_fu, func)
+        logger.debug("Added output dependencies")
+        # Replace the function invocation in the TaskRecord with whatever file-staging
+        # substitutions have been made.
         task_record.update({
                     'args': app_args,
                     'func': func,
-                    'kwargs': app_kwargs,
-                    'app_fu': app_fu})
+                    'kwargs': app_kwargs})
         assert task_id not in self.tasks
         self.tasks[task_id] = task_record
+        logger.debug("Gathering dependencies")
         # Get the list of dependencies for the task
         depends = self._gather_all_deps(app_args, app_kwargs)
+        logger.debug("Gathered dependencies")
         task_record['depends'] = depends
         depend_descs = []
@@ -1085,73 +1138,28 @@ class DataFlowKernel:
         logger.info("End of summary")
-    def _create_remote_dirs_over_channel(self, provider: ExecutionProvider, channel: Channel) -> None:
-        """Create script directories across a channel
-        Parameters
-        ----------
-        provider: Provider obj
-           Provider for which scripts dirs are being created
-        channel: Channel obj
-           Channel over which the remote dirs are to be created
-        """
-        run_dir = self.run_dir
-        if channel.script_dir is None:
-            # This case will be detected as unreachable by mypy, because of
-            # the type of script_dir, which is str, not Optional[str].
-            # The type system doesn't represent the initialized/uninitialized
-            # state of a channel so cannot represent that a channel needs
-            # its script directory set or not.
-            channel.script_dir = os.path.join(run_dir, 'submit_scripts')  # type: ignore[unreachable]
-            # Only create dirs if we aren't on a shared-fs
-            if not channel.isdir(run_dir):
-                parent, child = pathlib.Path(run_dir).parts[-2:]
-                remote_run_dir = os.path.join(parent, child)
-                channel.script_dir = os.path.join(remote_run_dir, 'remote_submit_scripts')
-                provider.script_dir = os.path.join(run_dir, 'local_submit_scripts')
-        channel.makedirs(channel.script_dir, exist_ok=True)
-    def add_executors(self, executors):
+    def add_executors(self, executors: Sequence[ParslExecutor]) -> None:
         for executor in executors:
             executor.run_id = self.run_id
             executor.run_dir = self.run_dir
-            executor.hub_address = self.hub_address
-            executor.hub_port = self.hub_interchange_port
+            if self.monitoring:
+                executor.hub_address = self.monitoring.hub_address
+                executor.hub_zmq_port = self.monitoring.hub_zmq_port
+                executor.submit_monitoring_radio = self.monitoring.radio
             if hasattr(executor, 'provider'):
                 if hasattr(executor.provider, 'script_dir'):
                     executor.provider.script_dir = os.path.join(self.run_dir, 'submit_scripts')
                     os.makedirs(executor.provider.script_dir, exist_ok=True)
-                    if hasattr(executor.provider, 'channels'):
-                        logger.debug("Creating script_dir across multiple channels")
-                        for channel in executor.provider.channels:
-                            self._create_remote_dirs_over_channel(executor.provider, channel)
-                    else:
-                        self._create_remote_dirs_over_channel(executor.provider, executor.provider.channel)
             self.executors[executor.label] = executor
-            block_ids = executor.start()
-            if self.monitoring and block_ids:
-                new_status = {}
-                for bid in block_ids:
-                    new_status[bid] = JobStatus(JobState.PENDING)
-                msg = executor.create_monitoring_info(new_status)
-                logger.debug("Sending monitoring message {} to hub from DFK".format(msg))
-                self.monitoring.send(MessageType.BLOCK_INFO, msg)
+            executor.start()
         block_executors = [e for e in executors if isinstance(e, BlockProviderExecutor)]
         self.job_status_poller.add_executors(block_executors)
     def atexit_cleanup(self) -> None:
-        if not self.cleanup_called:
-            logger.warning("Python is exiting with a DFK still running. "
-                           "You should call parsl.dfk().cleanup() before "
-                           "exiting to release any resources")
-        else:
-            logger.info("python process is exiting, but DFK has already been cleaned up")
+        logger.warning("Python is exiting with a DFK still running. "
+                       "You should call parsl.dfk().cleanup() before "
+                       "exiting to release any resources")
     def wait_for_current_tasks(self) -> None:
         """Waits for all tasks in the task list to be completed, by waiting for their
@@ -1207,31 +1215,18 @@ class DataFlowKernel:
                 self._checkpoint_timer.close()
         # Send final stats
+        logger.info("Sending end message for usage tracking")
         self.usage_tracker.send_end_message()
         self.usage_tracker.close()
+        logger.info("Closed usage tracking")
         logger.info("Closing job status poller")
         self.job_status_poller.close()
         logger.info("Terminated job status poller")
-        logger.info("Scaling in and shutting down executors")
+        logger.info("Shutting down executors")
         for executor in self.executors.values():
-            if isinstance(executor, BlockProviderExecutor):
-                if not executor.bad_state_is_set:
-                    logger.info(f"Scaling in executor {executor.label}")
-                    if executor.provider:
-                        job_ids = executor.provider.resources.keys()
-                        block_ids = executor.scale_in(len(job_ids))
-                        if self.monitoring and block_ids:
-                            new_status = {}
-                            for bid in block_ids:
-                                new_status[bid] = JobStatus(JobState.CANCELLED)
-                            msg = executor.create_monitoring_info(new_status)
-                            logger.debug("Sending message {} to hub from DFK".format(msg))
-                            self.monitoring.send(MessageType.BLOCK_INFO, msg)
-                else:  # and bad_state_is_set
-                    logger.warning(f"Not shutting down executor {executor.label} because it is in bad state")
             logger.info(f"Shutting down executor {executor.label}")
             executor.shutdown()
             logger.info(f"Shut down executor {executor.label}")
@@ -1241,18 +1236,32 @@ class DataFlowKernel:
         if self.monitoring:
             logger.info("Sending final monitoring message")
-            self.monitoring.send(MessageType.WORKFLOW_INFO,
+            self.monitoring.send((MessageType.WORKFLOW_INFO,
                                  {'tasks_failed_count': self.task_state_counts[States.failed],
                                   'tasks_completed_count': self.task_state_counts[States.exec_done],
                                   "time_began": self.time_began,
                                   'time_completed': self.time_completed,
-                                  'run_id': self.run_id, 'rundir': self.run_dir,
-                                  'exit_now': True})
+                                  'run_id': self.run_id, 'rundir': self.run_dir}))
             logger.info("Terminating monitoring")
             self.monitoring.close()
             logger.info("Terminated monitoring")
+        logger.info("Terminating dependency launch pool")
+        self.dependency_launch_pool.shutdown()
+        logger.info("Terminated dependency launch pool")
+        logger.info("Unregistering atexit hook")
+        atexit.unregister(self.atexit_cleanup)
+        logger.info("Unregistered atexit hook")
+        if DataFlowKernelLoader._dfk is self:
+            logger.info("Unregistering default DFK")
+            parsl.clear()
+            logger.info("Unregistered default DFK")
+        else:
+            logger.debug("Cleaning up non-default DFK - not unregistering")
         logger.info("DFK cleanup complete")
     def checkpoint(self, tasks: Optional[Sequence[TaskRecord]] = None) -> str:
@@ -1388,8 +1397,6 @@ class DataFlowKernel:
         Returns:
              - dict containing, hashed -> future mappings
         """
-        self.memo_lookup_table = None
         if checkpointDirs:
             return self._load_checkpoints(checkpointDirs)
         else:
@@ -1397,10 +1404,39 @@ class DataFlowKernel:
     @staticmethod
     def _log_std_streams(task_record: TaskRecord) -> None:
-        if task_record['app_fu'].stdout is not None:
-            logger.info("Standard output for task {} available at {}".format(task_record['id'], task_record['app_fu'].stdout))
-        if task_record['app_fu'].stderr is not None:
-            logger.info("Standard error for task {} available at {}".format(task_record['id'], task_record['app_fu'].stderr))
+        tid = task_record['id']
+        def log_std_stream(name: str, target) -> None:
+            if target is None:
+                logger.info(f"{name} for task {tid} will not be redirected.")
+            elif isinstance(target, str):
+                logger.info(f"{name} for task {tid} will be redirected to {target}")
+            elif isinstance(target, os.PathLike):
+                logger.info(f"{name} for task {tid} will be redirected to {os.fspath(target)}")
+            elif isinstance(target, tuple) and len(target) == 2 and isinstance(target[0], str):
+                logger.info(f"{name} for task {tid} will be redirected to {target[0]} with mode {target[1]}")
+            elif isinstance(target, tuple) and len(target) == 2 and isinstance(target[0], os.PathLike):
+                logger.info(f"{name} for task {tid} will be redirected to {os.fspath(target[0])} with mode {target[1]}")
+            elif isinstance(target, DataFuture):
+                logger.info(f"{name} for task {tid} will staged to {target.file_obj.url}")
+            else:
+                logger.error(f"{name} for task {tid} has unknown specification: {target!r}")
+        log_std_stream("Standard out", task_record['app_fu'].stdout)
+        log_std_stream("Standard error", task_record['app_fu'].stderr)
+    def default_std_autopath(self, taskrecord, kw):
+        label = taskrecord['kwargs'].get('label')
+        task_id = taskrecord['id']
+        return os.path.join(
+            self.run_dir,
+            'task_logs',
+            str(int(task_id / 10000)).zfill(4),  # limit logs to 10k entries per directory
+            'task_{}_{}{}.{}'.format(
+                str(task_id).zfill(4),
+                taskrecord['func_name'],
+                '' if label is None else '_{}'.format(label),
+                kw))
 class DataFlowKernelLoader:

parsl 2024.3.18__py3-none-any.whl → 2025.1.13__py3-none-any.whl

parsl 2024.3.18py3-none-any.whl → 2025.1.13py3-none-any.whl