PyPI - ert - Versions diffs - 17.0.0__py3-none-any.whl → 19.0.0rc2__py3-none-any.whl - Mend

ert 17.0.0py3-none-any.whl → 19.0.0rc2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (218) hide show

_ert/events.py +19 -2
_ert/forward_model_runner/client.py +6 -2
ert/__main__.py +28 -13
ert/analysis/_enif_update.py +8 -4
ert/analysis/_es_update.py +19 -6
ert/analysis/_update_commons.py +16 -6
ert/cli/main.py +13 -6
ert/cli/monitor.py +7 -0
ert/config/__init__.py +15 -6
ert/config/_create_observation_dataframes.py +117 -20
ert/config/_get_num_cpu.py +1 -1
ert/config/_observations.py +91 -2
ert/config/_read_summary.py +8 -6
ert/config/design_matrix.py +51 -24
ert/config/distribution.py +1 -1
ert/config/ensemble_config.py +9 -17
ert/config/ert_config.py +103 -19
ert/config/everest_control.py +234 -0
ert/config/{everest_objective_config.py → everest_response.py} +24 -15
ert/config/field.py +96 -84
ert/config/forward_model_step.py +122 -17
ert/config/gen_data_config.py +5 -10
ert/config/gen_kw_config.py +5 -35
ert/config/known_response_types.py +14 -0
ert/config/parameter_config.py +1 -33
ert/config/parsing/_option_dict.py +10 -2
ert/config/parsing/config_keywords.py +2 -0
ert/config/parsing/config_schema.py +23 -3
ert/config/parsing/config_schema_deprecations.py +3 -14
ert/config/parsing/config_schema_item.py +26 -11
ert/config/parsing/context_values.py +3 -3
ert/config/parsing/file_context_token.py +1 -1
ert/config/parsing/observations_parser.py +6 -2
ert/config/parsing/queue_system.py +9 -0
ert/config/parsing/schema_item_type.py +1 -0
ert/config/queue_config.py +4 -5
ert/config/response_config.py +0 -8
ert/config/rft_config.py +275 -0
ert/config/summary_config.py +3 -8
ert/config/surface_config.py +59 -16
ert/config/workflow_fixtures.py +2 -1
ert/dark_storage/client/__init__.py +2 -2
ert/dark_storage/client/_session.py +4 -4
ert/dark_storage/client/client.py +2 -2
ert/dark_storage/common.py +1 -1
ert/dark_storage/compute/misfits.py +11 -7
ert/dark_storage/endpoints/compute/misfits.py +6 -4
ert/dark_storage/endpoints/experiment_server.py +12 -9
ert/dark_storage/endpoints/experiments.py +2 -2
ert/dark_storage/endpoints/observations.py +8 -6
ert/dark_storage/endpoints/parameters.py +2 -18
ert/dark_storage/endpoints/responses.py +24 -5
ert/dark_storage/json_schema/experiment.py +1 -1
ert/data/_measured_data.py +6 -5
ert/ensemble_evaluator/__init__.py +8 -1
ert/ensemble_evaluator/config.py +2 -1
ert/ensemble_evaluator/evaluator.py +81 -29
ert/ensemble_evaluator/event.py +6 -0
ert/ensemble_evaluator/snapshot.py +3 -1
ert/ensemble_evaluator/state.py +1 -0
ert/field_utils/__init__.py +8 -0
ert/field_utils/field_utils.py +212 -3
ert/field_utils/roff_io.py +1 -1
ert/gui/__init__.py +5 -2
ert/gui/ertnotifier.py +1 -1
ert/gui/ertwidgets/__init__.py +23 -16
ert/gui/ertwidgets/analysismoduleedit.py +2 -2
ert/gui/ertwidgets/checklist.py +1 -1
ert/gui/ertwidgets/create_experiment_dialog.py +3 -1
ert/gui/ertwidgets/ensembleselector.py +2 -2
ert/gui/ertwidgets/models/__init__.py +2 -0
ert/gui/ertwidgets/models/activerealizationsmodel.py +2 -1
ert/gui/ertwidgets/models/path_model.py +1 -1
ert/gui/ertwidgets/models/targetensemblemodel.py +2 -1
ert/gui/ertwidgets/models/text_model.py +1 -1
ert/gui/ertwidgets/pathchooser.py +0 -3
ert/gui/ertwidgets/searchbox.py +13 -4
ert/gui/{suggestor → ertwidgets/suggestor}/_suggestor_message.py +13 -4
ert/gui/{suggestor → ertwidgets/suggestor}/suggestor.py +63 -30
ert/gui/main.py +37 -8
ert/gui/main_window.py +1 -7
ert/gui/simulation/ensemble_experiment_panel.py +1 -1
ert/gui/simulation/ensemble_information_filter_panel.py +1 -1
ert/gui/simulation/ensemble_smoother_panel.py +1 -1
ert/gui/simulation/evaluate_ensemble_panel.py +1 -1
ert/gui/simulation/experiment_panel.py +16 -3
ert/gui/simulation/manual_update_panel.py +31 -8
ert/gui/simulation/multiple_data_assimilation_panel.py +12 -8
ert/gui/simulation/run_dialog.py +27 -20
ert/gui/simulation/single_test_run_panel.py +2 -2
ert/gui/summarypanel.py +20 -1
ert/gui/tools/load_results/load_results_panel.py +1 -1
ert/gui/tools/manage_experiments/export_dialog.py +136 -0
ert/gui/tools/manage_experiments/storage_info_widget.py +121 -16
ert/gui/tools/manage_experiments/storage_widget.py +1 -2
ert/gui/tools/plot/plot_api.py +37 -25
ert/gui/tools/plot/plot_widget.py +10 -2
ert/gui/tools/plot/plot_window.py +38 -18
ert/gui/tools/plot/plottery/plot_config.py +2 -0
ert/gui/tools/plot/plottery/plot_context.py +14 -0
ert/gui/tools/plot/plottery/plots/__init__.py +2 -0
ert/gui/tools/plot/plottery/plots/cesp.py +3 -1
ert/gui/tools/plot/plottery/plots/distribution.py +6 -1
ert/gui/tools/plot/plottery/plots/ensemble.py +12 -3
ert/gui/tools/plot/plottery/plots/gaussian_kde.py +12 -2
ert/gui/tools/plot/plottery/plots/histogram.py +3 -1
ert/gui/tools/plot/plottery/plots/misfits.py +436 -0
ert/gui/tools/plot/plottery/plots/observations.py +18 -4
ert/gui/tools/plot/plottery/plots/statistics.py +62 -20
ert/gui/tools/plot/plottery/plots/std_dev.py +3 -1
ert/mode_definitions.py +2 -0
ert/plugins/__init__.py +0 -1
ert/plugins/hook_implementations/workflows/csv_export.py +2 -3
ert/plugins/hook_implementations/workflows/gen_data_rft_export.py +10 -2
ert/plugins/hook_specifications/__init__.py +0 -2
ert/plugins/hook_specifications/jobs.py +0 -9
ert/plugins/plugin_manager.py +6 -33
ert/resources/forward_models/run_reservoirsimulator.py +8 -3
ert/resources/shell_scripts/delete_directory.py +2 -2
ert/run_models/__init__.py +18 -5
ert/run_models/_create_run_path.py +131 -37
ert/run_models/ensemble_experiment.py +10 -4
ert/run_models/ensemble_information_filter.py +8 -1
ert/run_models/ensemble_smoother.py +9 -3
ert/run_models/evaluate_ensemble.py +8 -6
ert/run_models/event.py +7 -3
ert/run_models/everest_run_model.py +159 -46
ert/run_models/initial_ensemble_run_model.py +25 -24
ert/run_models/manual_update.py +6 -3
ert/run_models/manual_update_enif.py +37 -0
ert/run_models/model_factory.py +81 -21
ert/run_models/multiple_data_assimilation.py +22 -11
ert/run_models/run_model.py +64 -55
ert/run_models/single_test_run.py +7 -4
ert/run_models/update_run_model.py +4 -2
ert/runpaths.py +5 -6
ert/sample_prior.py +9 -4
ert/scheduler/driver.py +37 -0
ert/scheduler/event.py +3 -1
ert/scheduler/job.py +23 -13
ert/scheduler/lsf_driver.py +6 -2
ert/scheduler/openpbs_driver.py +7 -1
ert/scheduler/scheduler.py +5 -0
ert/scheduler/slurm_driver.py +6 -2
ert/services/__init__.py +2 -2
ert/services/_base_service.py +37 -20
ert/services/ert_server.py +317 -0
ert/shared/_doc_utils/__init__.py +4 -2
ert/shared/_doc_utils/ert_jobs.py +1 -4
ert/shared/net_utils.py +43 -18
ert/shared/storage/connection.py +3 -3
ert/shared/version.py +3 -3
ert/storage/__init__.py +2 -0
ert/storage/local_ensemble.py +38 -12
ert/storage/local_experiment.py +8 -16
ert/storage/local_storage.py +68 -42
ert/storage/migration/to11.py +1 -1
ert/storage/migration/to16.py +38 -0
ert/storage/migration/to17.py +42 -0
ert/storage/migration/to18.py +11 -0
ert/storage/migration/to19.py +34 -0
ert/storage/migration/to20.py +23 -0
ert/storage/migration/to21.py +25 -0
ert/storage/migration/to8.py +4 -4
ert/substitutions.py +12 -28
ert/validation/active_range.py +7 -7
ert/validation/rangestring.py +16 -16
ert/workflow_runner.py +2 -1
{ert-17.0.0.dist-info → ert-19.0.0rc2.dist-info}/METADATA +9 -8
{ert-17.0.0.dist-info → ert-19.0.0rc2.dist-info}/RECORD +208 -205
{ert-17.0.0.dist-info → ert-19.0.0rc2.dist-info}/WHEEL +1 -1
everest/api/everest_data_api.py +14 -1
everest/bin/config_branch_script.py +3 -6
everest/bin/everconfigdump_script.py +1 -9
everest/bin/everest_script.py +21 -11
everest/bin/everlint_script.py +0 -2
everest/bin/kill_script.py +2 -2
everest/bin/monitor_script.py +2 -2
everest/bin/utils.py +8 -4
everest/bin/visualization_script.py +6 -14
everest/config/__init__.py +4 -1
everest/config/control_config.py +81 -6
everest/config/control_variable_config.py +4 -3
everest/config/everest_config.py +75 -42
everest/config/forward_model_config.py +5 -3
everest/config/install_data_config.py +7 -5
everest/config/install_job_config.py +7 -3
everest/config/install_template_config.py +3 -3
everest/config/optimization_config.py +19 -6
everest/config/output_constraint_config.py +8 -2
everest/config/server_config.py +6 -49
everest/config/utils.py +25 -105
everest/config/validation_utils.py +17 -11
everest/config_file_loader.py +13 -4
everest/detached/client.py +3 -3
everest/detached/everserver.py +7 -8
everest/everest_storage.py +6 -12
everest/gui/everest_client.py +2 -3
everest/gui/main_window.py +2 -2
everest/optimizer/everest2ropt.py +59 -32
everest/optimizer/opt_model_transforms.py +12 -13
everest/optimizer/utils.py +0 -29
everest/strings.py +0 -5
ert/config/everest_constraints_config.py +0 -95
ert/config/ext_param_config.py +0 -106
ert/gui/tools/export/__init__.py +0 -3
ert/gui/tools/export/export_panel.py +0 -83
ert/gui/tools/export/export_tool.py +0 -69
ert/gui/tools/export/exporter.py +0 -36
ert/services/storage_service.py +0 -127
everest/config/sampler_config.py +0 -103
everest/simulator/__init__.py +0 -88
everest/simulator/everest_to_ert.py +0 -51
/ert/gui/{suggestor → ertwidgets/suggestor}/__init__.py +0 -0
/ert/gui/{suggestor → ertwidgets/suggestor}/_colors.py +0 -0
{ert-17.0.0.dist-info → ert-19.0.0rc2.dist-info}/entry_points.txt +0 -0
{ert-17.0.0.dist-info → ert-19.0.0rc2.dist-info}/licenses/COPYING +0 -0
{ert-17.0.0.dist-info → ert-19.0.0rc2.dist-info}/top_level.txt +0 -0

ert/runpaths.py CHANGED Viewed

@@ -101,14 +101,13 @@ class Runpaths:
         with open(self.runpath_list_filename, "w", encoding="utf-8") as filehandle:
             for iteration in iteration_numbers:
                 for realization in realization_numbers:
-                    job_name_or_eclbase = self.substitutions.substitute_real_iter(
-                        self._eclbase or self._jobname_format,
-                        realization,
-                        iteration,
+                    real_iter_substituter = self.substitutions.real_iter_substituter(
+                        realization, iteration
                     )
-                    runpath = self.substitutions.substitute_real_iter(
-                        self._runpath_format, realization, iteration
+                    job_name_or_eclbase = real_iter_substituter.substitute(
+                        self._eclbase or self._jobname_format,
                     )
+                    runpath = real_iter_substituter.substitute(self._runpath_format)
                     filehandle.write(
                         f"{realization:03d}  {runpath}  "

ert/sample_prior.py CHANGED Viewed

@@ -33,6 +33,7 @@ def sample_prior(
     parameter_configs = ensemble.experiment.parameter_configuration
     if parameters is None:
         parameters = list(parameter_configs.keys())
+    complete_dataset: pl.DataFrame | None = None
     for parameter in parameters:
         config_node = parameter_configs[parameter]
         if config_node.forward_init:
@@ -75,13 +76,17 @@ def sample_prior(
                 if datasets:
                     dataset = pl.concat(datasets, how="vertical")
-            if dataset is not None:
-                ensemble.save_parameters(
-                    dataset=dataset,
-                )
+            if complete_dataset is None:
+                complete_dataset = dataset
+            elif dataset is not None:
+                complete_dataset = complete_dataset.join(dataset, on="realization")
         else:
             for realization_nr in active_realizations:
                 ds = config_node.read_from_runpath(Path(), realization_nr, 0)
                 ensemble.save_parameters(ds, parameter, realization_nr)
+    if complete_dataset is not None:
+        ensemble.save_parameters(
+            dataset=complete_dataset,
+        )
     ensemble.refresh_ensemble_state()

ert/scheduler/driver.py CHANGED Viewed

@@ -3,10 +3,13 @@ from __future__ import annotations
 import asyncio
 import logging
 import shlex
+import time
 from abc import ABC, abstractmethod
 from collections.abc import Iterable
 from pathlib import Path
+from _ert.events import EnsembleEvaluationWarning
 from .event import DriverEvent
 SIGNAL_OFFSET = 128
@@ -34,12 +37,19 @@ class FailedSubmit(RuntimeError):
 class Driver(ABC):
     """Adapter for the HPC cluster."""
+    POLLING_TIMEOUT_PERIOD = 600
     def __init__(self, activate_script: str = "") -> None:
         self._event_queue: asyncio.Queue[DriverEvent] | None = None
         self._job_error_message_by_iens: dict[int, str] = {}
         self.activate_script = activate_script
         self._poll_period = _POLL_PERIOD
+        self._polling_timeout_period = Driver.POLLING_TIMEOUT_PERIOD
+        self._last_successful_poll = time.time()
+        self._last_polling_error_message: str | None = None
+        self._has_warned_evaluator_of_polling_error = False
     @property
     def event_queue(self) -> asyncio.Queue[DriverEvent]:
         if self._event_queue is None:
@@ -178,3 +188,30 @@ class Driver(ABC):
         )
         logger.error(error_message)
         return False, error_message
+    async def _warn_evaluator_if_polling_has_failed_for_some_time(self) -> None:
+        if (
+            (self._last_successful_poll < time.time() - self._polling_timeout_period)
+            and self._last_polling_error_message
+            and not self._has_warned_evaluator_of_polling_error
+        ):
+            await self._warn_evaluator_about_polling_difficulties()
+            self._has_warned_evaluator_of_polling_error = True
+    async def _warn_evaluator_about_polling_difficulties(self) -> None:
+        last_polling_error_message = self._last_polling_error_message
+        logger = logging.getLogger(__name__)
+        logger.warning(
+            "Driver has not successfully polled statuses for "
+            f"{self._polling_timeout_period}s. The previous error "
+            f"was due to '{last_polling_error_message}'"
+        )
+        formatted_msg = (
+            "ert has not been able to update the job status for some time. This might "
+            "be resolved by itself, and it does not mean that the run has crashed.\n"
+            "Please check the runpath if it seems to still be running.\n"
+            f"The last error message was '{last_polling_error_message}'"
+        )
+        await self.event_queue.put(
+            EnsembleEvaluationWarning(warning_message=formatted_msg)
+        )

ert/scheduler/event.py CHANGED Viewed

@@ -2,6 +2,8 @@ from __future__ import annotations
 from dataclasses import dataclass
+from _ert.events import EnsembleEvaluationWarning
 @dataclass
 class StartedEvent:
@@ -16,4 +18,4 @@ class FinishedEvent:
     exec_hosts: str = "-"
-DriverEvent = StartedEvent | FinishedEvent
+DriverEvent = StartedEvent | FinishedEvent | EnsembleEvaluationWarning

ert/scheduler/job.py CHANGED Viewed

@@ -12,6 +12,7 @@ from enum import StrEnum
 from pathlib import Path
 from typing import TYPE_CHECKING, assert_never
+import anyio
 from lxml import etree
 from opentelemetry.trace import Status, StatusCode
@@ -31,7 +32,7 @@ from ert.storage import (
     RealizationStorageState,
     load_realization_parameters_and_responses,
 )
-from ert.trace import trace, tracer
+from ert.trace import trace
 from ert.warnings import PostSimulationWarning
 from .driver import Driver, FailedSubmit
@@ -238,7 +239,6 @@ class Job:
                 f"{method_name} spent {elapsed_time} seconds waiting for files"
             )
-    @tracer.start_as_current_span(f"{__name__}.run")
     async def run(
         self,
         sem: asyncio.BoundedSemaphore,
@@ -335,8 +335,12 @@ class Job:
         valid_checksums = [info for info in checksum.values() if "error" not in info]
-        # Wait for files in checksum
-        while not all(Path(info["path"]).exists() for info in valid_checksums):
+        async def all_paths_exist(paths: list[Path]) -> bool:
+            return all(
+                await asyncio.gather(*[anyio.Path(path).exists() for path in paths])
+            )
+        while not await all_paths_exist([info["path"] for info in valid_checksums]):
             if timeout <= 0:
                 break
             timeout -= DISK_SYNCHRONIZATION_POLLING_INTERVAL
@@ -344,17 +348,19 @@ class Job:
             await asyncio.sleep(DISK_SYNCHRONIZATION_POLLING_INTERVAL)
         async with checksum_lock:
             for info in valid_checksums:
-                file_path = Path(info["path"])
+                file_path = anyio.Path(info["path"])
                 expected_md5sum = info.get("md5sum")
-                if file_path.exists() and expected_md5sum:
-                    actual_md5sum = hashlib.md5(file_path.read_bytes()).hexdigest()
+                file_path_exists = await file_path.exists()
+                if file_path_exists and expected_md5sum:
+                    file_bytes = await file_path.read_bytes()
+                    actual_md5sum = hashlib.md5(file_bytes).hexdigest()
                     if expected_md5sum == actual_md5sum:
                         logger.debug(f"File {file_path} checksum successful.")
                     else:
                         logger.warning(
                             f"File {file_path} checksum verification failed."
                         )
-                elif file_path.exists() and expected_md5sum is None:
+                elif file_path_exists and expected_md5sum is None:
                     logger.warning(f"Checksum not received for file {file_path}")
                 else:
                     logger.error(f"Disk synchronization failed for {file_path}")
@@ -506,11 +512,12 @@ async def log_warnings_from_forward_model(
             or "- ERROR - " in line
         )
-    async def log_warnings_from_file(  # noqa
+    async def log_warnings_from_file(
         file: Path, iens: int, step: ForwardModelStep, step_idx: int, filetype: str
     ) -> None:
         captured: list[str] = []
-        for line in file.read_text(encoding="utf-8").splitlines():
+        file_text = await anyio.Path(file).read_text(encoding="utf-8")
+        for line in file_text.splitlines():
             if line_contains_warning(line):
                 captured.append(line[:max_length])
@@ -527,9 +534,12 @@ async def log_warnings_from_forward_model(
             return 0
         remaining_timeout = _timeout
         for _ in range(_timeout):
-            if not (
-                file_path.exists() and file_path.stat().st_mtime >= job_submission_time
-            ):
+            file_path_exists = await anyio.Path(file_path).exists()
+            if file_path_exists:
+                st_mtime = (await anyio.Path(file_path).stat()).st_mtime
+            else:
+                st_mtime = 0
+            if not (file_path_exists and st_mtime >= job_submission_time):
                 remaining_timeout -= 1
                 await asyncio.sleep(1)
             else:

ert/scheduler/lsf_driver.py CHANGED Viewed

@@ -444,6 +444,7 @@ class LsfDriver(Driver):
     async def poll(self) -> None:
         while True:
+            await self._warn_evaluator_if_polling_has_failed_for_some_time()
             if not self._jobs.keys():
                 await asyncio.sleep(self._poll_period)
                 continue
@@ -461,6 +462,7 @@ class LsfDriver(Driver):
                 )
             except OSError as e:
                 logger.error(str(e))
+                self._last_polling_error_message = str(e)
                 await asyncio.sleep(self._poll_period)
                 continue
@@ -468,10 +470,11 @@ class LsfDriver(Driver):
             if process.returncode:
                 # bjobs may give nonzero return code even when it is providing
                 # at least some correct information
+                error_msg = stderr.decode()
                 logger.warning(
-                    f"bjobs gave returncode {process.returncode} "
-                    f"and error {stderr.decode()}"
+                    f"bjobs gave returncode {process.returncode} and error {error_msg}"
                 )
+                self._last_polling_error_message = error_msg
             bjobs_states = _parse_jobs_dict(parse_bjobs(stdout.decode(errors="ignore")))
             self.update_and_log_exec_hosts(
                 parse_bjobs_exec_hosts(stdout.decode(errors="ignore"))
@@ -503,6 +506,7 @@ class LsfDriver(Driver):
                     "bhist did not give status for job_ids "
                     f"{missing_in_bhist_and_bjobs}, giving up for now."
                 )
+            self._last_successful_poll = time.time()
             await asyncio.sleep(self._poll_period)
     async def _process_job_update(self, job_id: str, new_state: AnyJob) -> None:

ert/scheduler/openpbs_driver.py CHANGED Viewed

@@ -5,6 +5,7 @@ import json
 import logging
 import shlex
 import shutil
+import time
 from collections.abc import Iterable, Mapping, MutableMapping
 from dataclasses import dataclass
 from pathlib import Path
@@ -264,6 +265,7 @@ class OpenPBSDriver(Driver):
     async def poll(self) -> None:
         while True:
+            await self._warn_evaluator_if_polling_has_failed_for_some_time()
             if not self._jobs:
                 await asyncio.sleep(self._poll_period)
                 continue
@@ -280,6 +282,7 @@ class OpenPBSDriver(Driver):
                     )
                 except OSError as e:
                     logger.error(str(e))
+                    self._last_polling_error_message = str(e)
                     await asyncio.sleep(self._poll_period)
                     continue
                 stdout, stderr = await process.communicate()
@@ -289,10 +292,12 @@ class OpenPBSDriver(Driver):
                     await asyncio.sleep(self._poll_period)
                     continue
                 if process.returncode == QSTAT_UNKNOWN_JOB_ID:
+                    error_msg = stderr.decode(errors="ignore")
                     logger.debug(
                         f"qstat gave returncode {QSTAT_UNKNOWN_JOB_ID} "
-                        f"with message {stderr.decode(errors='ignore')}"
+                        f"with message {error_msg}"
                     )
+                    self._last_polling_error_message = error_msg
                 parsed_jobs = _parse_jobs_dict(
                     parse_qstat(stdout.decode(errors="ignore"))
                 )
@@ -330,6 +335,7 @@ class OpenPBSDriver(Driver):
                 for job_id, job in parsed_jobs_dict.items():
                     await self._process_job_update(job_id, job)
+            self._last_successful_poll = time.time()
             await asyncio.sleep(self._poll_period)
     async def _process_job_update(self, job_id: str, new_state: AnyJob) -> None:

ert/scheduler/scheduler.py CHANGED Viewed

@@ -15,6 +15,7 @@ import orjson
 from pydantic.dataclasses import dataclass
 from _ert.events import (
+    EnsembleEvaluationWarning,
     ForwardModelStepChecksum,
     RealizationEvent,
     RealizationFailed,
@@ -343,6 +344,10 @@ class Scheduler:
     async def _process_event_queue(self) -> None:
         while True:
             event = await self.driver.event_queue.get()
+            if isinstance(event, EnsembleEvaluationWarning):
+                if self._ensemble_evaluator_queue:
+                    await self._ensemble_evaluator_queue.put(event)
+                continue
             job = self._jobs[event.iens]
             # Any event implies the job has at least started

ert/scheduler/slurm_driver.py CHANGED Viewed

@@ -262,6 +262,7 @@ class SlurmDriver(Driver):
     async def poll(self) -> None:
         while True:
+            await self._warn_evaluator_if_polling_has_failed_for_some_time()
             if not self._jobs.keys():
                 await asyncio.sleep(self._poll_period)
                 continue
@@ -277,14 +278,16 @@ class SlurmDriver(Driver):
                 )
             except OSError as e:
                 logger.error(str(e))
+                self._last_polling_error_message = str(e)
                 await asyncio.sleep(self._poll_period)
                 continue
             stdout, stderr = await process.communicate()
             if process.returncode:
+                error_msg = stderr.decode()
                 logger.warning(
-                    f"squeue gave returncode {process.returncode} "
-                    f"and error {stderr.decode()}"
+                    f"squeue gave returncode {process.returncode} and error {error_msg}"
                 )
+                self._last_polling_error_message = error_msg
             squeue_states = dict(_parse_squeue_output(stdout.decode(errors="ignore")))
             job_ids_found_in_squeue_output = set(squeue_states.keys())
@@ -317,6 +320,7 @@ class SlurmDriver(Driver):
                     "scontrol did not give status for job_ids "
                     f"{missing_in_squeue_and_scontrol}, giving up for now."
                 )
+            self._last_successful_poll = time.time()
             await asyncio.sleep(self._poll_period)
     async def _process_job_update(self, job_id: str, new_info: JobInfo) -> None:

ert/services/__init__.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from .storage_service import StorageService
+from .ert_server import ErtServer
 from .webviz_ert_service import WebvizErt
-__all__ = ["StorageService", "WebvizErt"]
+__all__ = ["ErtServer", "WebvizErt"]

ert/services/_base_service.py CHANGED Viewed

@@ -1,3 +1,8 @@
+"""
+This file contains a more generic version of "ert services", and
+is scheduled for removal when WebvizErt is removed.
+"""
 from __future__ import annotations
 import contextlib
@@ -7,6 +12,7 @@ import os
 import signal
 import sys
 import threading
+import types
 from collections.abc import Callable, Mapping, Sequence
 from logging import Logger, getLogger
 from pathlib import Path
@@ -15,13 +21,21 @@ from subprocess import Popen, TimeoutExpired
 from tempfile import NamedTemporaryFile
 from time import sleep
 from types import FrameType
-from typing import TYPE_CHECKING, Any, Generic, Self, TypeVar
+from typing import TYPE_CHECKING, Any, Generic, Self, TypedDict, TypeVar
 if TYPE_CHECKING:
-    from inspect import Traceback
+    pass
 T = TypeVar("T", bound="BaseService")
-ConnInfo = Mapping[str, Any] | Exception | None
+class ErtServerConnectionInfo(TypedDict):
+    urls: list[str]
+    authtoken: str
+    host: str
+    port: str
+    cert: str
+    auth: str
 SERVICE_CONF_PATHS: set[str] = set()
@@ -74,9 +88,9 @@ class _Context(Generic[T]):
     def __exit__(
         self,
-        exc_type: type[BaseException],
-        exc_value: BaseException,
-        traceback: Traceback,
+        exc_type: type[BaseException] | None,
+        exc_value: BaseException | None,
+        traceback: types.TracebackType | None,
     ) -> bool:
         self._service.shutdown()
         return exc_type is None
@@ -88,7 +102,9 @@ class _Proc(threading.Thread):
         service_name: str,
         exec_args: Sequence[str],
         timeout: int,
-        set_conn_info: Callable[[ConnInfo], None],
+        on_connection_info_received: Callable[
+            [ErtServerConnectionInfo | Exception | None], None
+        ],
         project: Path,
     ) -> None:
         super().__init__()
@@ -98,7 +114,7 @@ class _Proc(threading.Thread):
         self._service_name = service_name
         self._exec_args = exec_args
         self._timeout = timeout
-        self._set_conn_info = set_conn_info
+        self._propagate_connection_info_from_childproc = on_connection_info_received
         self._service_config_path = project / f"{self._service_name}_server.json"
         fd_read, fd_write = os.pipe()
@@ -119,13 +135,13 @@ class _Proc(threading.Thread):
         os.close(fd_write)
     def run(self) -> None:
-        comm = self._read_conn_info(self._childproc)
+        comm = self._read_connection_info_from_process(self._childproc)
         if comm is None:
-            self._set_conn_info(TimeoutError())
+            self._propagate_connection_info_from_childproc(TimeoutError())
             return  # _read_conn_info() has already cleaned up in this case
-        conn_info: ConnInfo = None
+        conn_info: ErtServerConnectionInfo | Exception | None = None
         try:
             conn_info = json.loads(comm)
         except json.JSONDecodeError:
@@ -134,7 +150,7 @@ class _Proc(threading.Thread):
             conn_info = exc
         try:
-            self._set_conn_info(conn_info)
+            self._propagate_connection_info_from_childproc(conn_info)
             while True:
                 if self._childproc.poll() is not None:
@@ -148,15 +164,16 @@ class _Proc(threading.Thread):
             self.logger.exception(e)
         finally:
-            self._ensure_delete_conn_info()
+            self._ensure_connection_info_file_is_deleted()
     def shutdown(self) -> int:
         """Shutdown the server."""
         self._shutdown.set()
         self.join()
         return self._childproc.returncode
-    def _read_conn_info(self, proc: Popen[bytes]) -> str | None:
+    def _read_connection_info_from_process(self, proc: Popen[bytes]) -> str | None:
         comm_buf = io.StringIO()
         first_iter = True
         while first_iter or proc.poll() is None:
@@ -166,7 +183,7 @@ class _Proc(threading.Thread):
             # Timeout reached, exit with a failure
             if ready == ([], [], []):
                 self._do_shutdown()
-                self._ensure_delete_conn_info()
+                self._ensure_connection_info_file_is_deleted()
                 return None
             x = self._comm_pipe.read(PIPE_BUF)
@@ -190,7 +207,7 @@ class _Proc(threading.Thread):
                     f"waiting for child-process exceeded timeout {self._timeout}s"
                 )
-    def _ensure_delete_conn_info(self) -> None:
+    def _ensure_connection_info_file_is_deleted(self) -> None:
         """
         Ensure that the JSON connection information file is deleted
         """
@@ -241,14 +258,14 @@ class BaseService:
         self,
         exec_args: Sequence[str] = (),
         timeout: int = 120,
-        conn_info: ConnInfo = None,
+        conn_info: ErtServerConnectionInfo | Exception | None = None,
         project: str | None = None,
     ) -> None:
         self._exec_args = exec_args
         self._timeout = timeout
         self._proc: _Proc | None = None
-        self._conn_info: ConnInfo = conn_info
+        self._conn_info: ErtServerConnectionInfo | Exception | None = conn_info
         self._conn_info_event = threading.Event()
         self._project = Path(project) if project is not None else Path.cwd()
@@ -261,7 +278,7 @@ class BaseService:
             )
     @classmethod
-    def start_server(cls: type[T], *args: Any, **kwargs: Any) -> _Context[T]:
+    def start_server(cls, *args: Any, **kwargs: Any) -> _Context[Self]:
         if cls._instance is not None:
             raise RuntimeError("Server already running")
         cls._instance = obj = cls(*args, **kwargs)
@@ -313,7 +330,7 @@ class BaseService:
         if self._proc is not None:
             self._proc.join()
-    def set_conn_info(self, info: ConnInfo) -> None:
+    def set_conn_info(self, info: ErtServerConnectionInfo | Exception | None) -> None:
         if self._conn_info is not None:
             raise ValueError("Connection information already set")
         if info is None:

ert 17.0.0__py3-none-any.whl → 19.0.0rc2__py3-none-any.whl

ert 17.0.0py3-none-any.whl → 19.0.0rc2py3-none-any.whl