PyPI - disdrodb - Versions diffs - 0.1.2__py3-none-any.whl → 0.1.4__py3-none-any.whl - Mend

disdrodb 0.1.2py3-none-any.whl → 0.1.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (142) hide show

disdrodb/__init__.py +68 -34
disdrodb/_config.py +5 -4
disdrodb/_version.py +16 -3
disdrodb/accessor/__init__.py +20 -0
disdrodb/accessor/methods.py +125 -0
disdrodb/api/checks.py +177 -24
disdrodb/api/configs.py +3 -3
disdrodb/api/info.py +13 -13
disdrodb/api/io.py +281 -22
disdrodb/api/path.py +184 -195
disdrodb/api/search.py +18 -9
disdrodb/cli/disdrodb_create_summary.py +103 -0
disdrodb/cli/disdrodb_create_summary_station.py +91 -0
disdrodb/cli/disdrodb_run_l0.py +1 -1
disdrodb/cli/disdrodb_run_l0_station.py +1 -1
disdrodb/cli/disdrodb_run_l0a_station.py +1 -1
disdrodb/cli/disdrodb_run_l0b.py +1 -1
disdrodb/cli/disdrodb_run_l0b_station.py +3 -3
disdrodb/cli/disdrodb_run_l0c.py +1 -1
disdrodb/cli/disdrodb_run_l0c_station.py +3 -3
disdrodb/cli/disdrodb_run_l1_station.py +2 -2
disdrodb/cli/disdrodb_run_l2e_station.py +2 -2
disdrodb/cli/disdrodb_run_l2m_station.py +2 -2
disdrodb/configs.py +149 -4
disdrodb/constants.py +61 -0
disdrodb/data_transfer/download_data.py +127 -11
disdrodb/etc/configs/attributes.yaml +339 -0
disdrodb/etc/configs/encodings.yaml +473 -0
disdrodb/etc/products/L1/global.yaml +13 -0
disdrodb/etc/products/L2E/10MIN.yaml +12 -0
disdrodb/etc/products/L2E/1MIN.yaml +1 -0
disdrodb/etc/products/L2E/global.yaml +22 -0
disdrodb/etc/products/L2M/10MIN.yaml +12 -0
disdrodb/etc/products/L2M/GAMMA_ML.yaml +8 -0
disdrodb/etc/products/L2M/NGAMMA_GS_LOG_ND_MAE.yaml +6 -0
disdrodb/etc/products/L2M/NGAMMA_GS_ND_MAE.yaml +6 -0
disdrodb/etc/products/L2M/NGAMMA_GS_Z_MAE.yaml +6 -0
disdrodb/etc/products/L2M/global.yaml +26 -0
disdrodb/issue/writer.py +2 -0
disdrodb/l0/__init__.py +13 -0
disdrodb/l0/configs/LPM/l0b_cf_attrs.yml +4 -4
disdrodb/l0/configs/PARSIVEL/l0b_cf_attrs.yml +1 -1
disdrodb/l0/configs/PARSIVEL/l0b_encodings.yml +3 -3
disdrodb/l0/configs/PARSIVEL/raw_data_format.yml +1 -1
disdrodb/l0/configs/PARSIVEL2/l0b_cf_attrs.yml +5 -5
disdrodb/l0/configs/PARSIVEL2/l0b_encodings.yml +3 -3
disdrodb/l0/configs/PARSIVEL2/raw_data_format.yml +1 -1
disdrodb/l0/configs/PWS100/l0b_cf_attrs.yml +4 -4
disdrodb/l0/configs/PWS100/raw_data_format.yml +1 -1
disdrodb/l0/l0a_processing.py +37 -32
disdrodb/l0/l0b_nc_processing.py +118 -8
disdrodb/l0/l0b_processing.py +30 -65
disdrodb/l0/l0c_processing.py +369 -259
disdrodb/l0/readers/LPM/ARM/ARM_LPM.py +7 -0
disdrodb/l0/readers/LPM/NETHERLANDS/DELFT_LPM_NC.py +66 -0
disdrodb/l0/readers/LPM/SLOVENIA/{CRNI_VRH.py → UL.py} +3 -0
disdrodb/l0/readers/LPM/SWITZERLAND/INNERERIZ_LPM.py +195 -0
disdrodb/l0/readers/PARSIVEL/GPM/PIERS.py +0 -2
disdrodb/l0/readers/PARSIVEL/JAPAN/JMA.py +4 -1
disdrodb/l0/readers/PARSIVEL/NCAR/PECAN_MOBILE.py +1 -1
disdrodb/l0/readers/PARSIVEL/NCAR/VORTEX2_2009.py +1 -1
disdrodb/l0/readers/PARSIVEL2/ARM/ARM_PARSIVEL2.py +4 -0
disdrodb/l0/readers/PARSIVEL2/BELGIUM/ILVO.py +168 -0
disdrodb/l0/readers/PARSIVEL2/CANADA/UQAM_NC.py +69 -0
disdrodb/l0/readers/PARSIVEL2/DENMARK/DTU.py +165 -0
disdrodb/l0/readers/PARSIVEL2/FINLAND/FMI_PARSIVEL2.py +69 -0
disdrodb/l0/readers/PARSIVEL2/FRANCE/ENPC_PARSIVEL2.py +255 -134
disdrodb/l0/readers/PARSIVEL2/FRANCE/OSUG.py +525 -0
disdrodb/l0/readers/PARSIVEL2/FRANCE/SIRTA_PARSIVEL2.py +1 -1
disdrodb/l0/readers/PARSIVEL2/GPM/GCPEX.py +9 -7
disdrodb/l0/readers/PARSIVEL2/KIT/BURKINA_FASO.py +1 -1
disdrodb/l0/readers/PARSIVEL2/KIT/TEAMX.py +123 -0
disdrodb/l0/readers/PARSIVEL2/{NETHERLANDS/DELFT.py → MPI/BCO_PARSIVEL2.py} +41 -71
disdrodb/l0/readers/PARSIVEL2/MPI/BOWTIE.py +220 -0
disdrodb/l0/readers/PARSIVEL2/NASA/APU.py +120 -0
disdrodb/l0/readers/PARSIVEL2/NASA/LPVEX.py +109 -0
disdrodb/l0/readers/PARSIVEL2/NCAR/FARM_PARSIVEL2.py +1 -0
disdrodb/l0/readers/PARSIVEL2/NCAR/PECAN_FP3.py +1 -1
disdrodb/l0/readers/PARSIVEL2/NCAR/PERILS_MIPS.py +126 -0
disdrodb/l0/readers/PARSIVEL2/NCAR/PERILS_PIPS.py +165 -0
disdrodb/l0/readers/PARSIVEL2/NCAR/VORTEX_SE_2016_P2.py +1 -1
disdrodb/l0/readers/PARSIVEL2/NCAR/VORTEX_SE_2016_PIPS.py +20 -12
disdrodb/l0/readers/PARSIVEL2/NETHERLANDS/DELFT_NC.py +5 -0
disdrodb/l0/readers/PARSIVEL2/SPAIN/CENER.py +144 -0
disdrodb/l0/readers/PARSIVEL2/SPAIN/CR1000DL.py +201 -0
disdrodb/l0/readers/PARSIVEL2/SPAIN/LIAISE.py +137 -0
disdrodb/l0/readers/PARSIVEL2/USA/C3WE.py +146 -0
disdrodb/l0/readers/PWS100/FRANCE/ENPC_PWS100.py +105 -99
disdrodb/l0/readers/PWS100/FRANCE/ENPC_PWS100_SIRTA.py +151 -0
disdrodb/l1/__init__.py +5 -0
disdrodb/l1/fall_velocity.py +46 -0
disdrodb/l1/filters.py +34 -20
disdrodb/l1/processing.py +46 -45
disdrodb/l1/resampling.py +77 -66
disdrodb/l1_env/routines.py +18 -3
disdrodb/l2/__init__.py +7 -0
disdrodb/l2/empirical_dsd.py +58 -10
disdrodb/l2/processing.py +268 -117
disdrodb/metadata/checks.py +132 -125
disdrodb/metadata/standards.py +3 -1
disdrodb/psd/fitting.py +631 -345
disdrodb/psd/models.py +9 -6
disdrodb/routines/__init__.py +54 -0
disdrodb/{l0/routines.py → routines/l0.py} +316 -355
disdrodb/{l1/routines.py → routines/l1.py} +76 -116
disdrodb/routines/l2.py +1019 -0
disdrodb/{routines.py → routines/wrappers.py} +98 -10
disdrodb/scattering/__init__.py +16 -4
disdrodb/scattering/axis_ratio.py +61 -37
disdrodb/scattering/permittivity.py +504 -0
disdrodb/scattering/routines.py +746 -184
disdrodb/summary/__init__.py +17 -0
disdrodb/summary/routines.py +4196 -0
disdrodb/utils/archiving.py +434 -0
disdrodb/utils/attrs.py +68 -125
disdrodb/utils/cli.py +5 -5
disdrodb/utils/compression.py +30 -1
disdrodb/utils/dask.py +121 -9
disdrodb/utils/dataframe.py +61 -7
disdrodb/utils/decorators.py +31 -0
disdrodb/utils/directories.py +35 -15
disdrodb/utils/encoding.py +37 -19
disdrodb/{l2 → utils}/event.py +15 -173
disdrodb/utils/logger.py +14 -7
disdrodb/utils/manipulations.py +81 -0
disdrodb/utils/routines.py +166 -0
disdrodb/utils/subsetting.py +214 -0
disdrodb/utils/time.py +35 -177
disdrodb/utils/writer.py +20 -7
disdrodb/utils/xarray.py +5 -4
disdrodb/viz/__init__.py +13 -0
disdrodb/viz/plots.py +398 -0
{disdrodb-0.1.2.dist-info → disdrodb-0.1.4.dist-info}/METADATA +4 -3
{disdrodb-0.1.2.dist-info → disdrodb-0.1.4.dist-info}/RECORD +139 -98
{disdrodb-0.1.2.dist-info → disdrodb-0.1.4.dist-info}/entry_points.txt +2 -0
disdrodb/l1/encoding_attrs.py +0 -642
disdrodb/l2/processing_options.py +0 -213
disdrodb/l2/routines.py +0 -868
/disdrodb/l0/readers/PARSIVEL/SLOVENIA/{UL_FGG.py → UL.py} +0 -0
{disdrodb-0.1.2.dist-info → disdrodb-0.1.4.dist-info}/WHEEL +0 -0
{disdrodb-0.1.2.dist-info → disdrodb-0.1.4.dist-info}/licenses/LICENSE +0 -0
{disdrodb-0.1.2.dist-info → disdrodb-0.1.4.dist-info}/top_level.txt +0 -0

disdrodb/{l0/routines.py → routines/l0.py} RENAMED Viewed

@@ -24,11 +24,7 @@ import os
 import time
 from typing import Optional
-import dask
-from disdrodb.api.checks import check_sensor_name
-# Directory
+from disdrodb.api.checks import check_measurement_intervals, check_sensor_name, check_station_inputs
 from disdrodb.api.create_directories import (
     create_l0_directory_structure,
     create_logs_directory,
@@ -40,7 +36,6 @@ from disdrodb.api.path import (
     define_l0a_filename,
     define_l0b_filename,
     define_l0c_filename,
-    define_metadata_filepath,
 )
 from disdrodb.api.search import get_required_product
 from disdrodb.configs import get_data_archive_dir, get_folder_partitioning, get_metadata_archive_dir
@@ -52,31 +47,21 @@ from disdrodb.l0.l0a_processing import (
     write_l0a,
 )
 from disdrodb.l0.l0b_nc_processing import sanitize_ds
-from disdrodb.l0.l0b_processing import (
-    create_l0b_from_l0a,
-    set_l0b_encodings,
-    write_l0b,
-)
-from disdrodb.l0.l0c_processing import (
-    create_daily_file,
-    get_files_per_days,
-    retrieve_possible_measurement_intervals,
-)
+from disdrodb.l0.l0b_processing import generate_l0b
+from disdrodb.l0.l0c_processing import TOLERANCE_SECONDS, create_l0c_datasets
 from disdrodb.metadata import read_station_metadata
+from disdrodb.utils.archiving import get_files_per_time_block
+from disdrodb.utils.dask import execute_tasks_safely
 from disdrodb.utils.decorators import delayed_if_parallel, single_threaded_if_parallel
 # Logger
 from disdrodb.utils.logger import (
-    close_logger,
-    create_logger_file,
     create_product_logs,
-    log_error,
     log_info,
+    # log_warning,
 )
-# log_warning,
+from disdrodb.utils.routines import run_product_generation, try_get_required_filepaths
 from disdrodb.utils.writer import write_product
-from disdrodb.utils.yaml import read_yaml
 logger = logging.getLogger(__name__)
@@ -90,8 +75,7 @@ def _generate_l0a(
     filepath,
     data_dir,
     logs_dir,
-    campaign_name,
-    station_name,
+    logs_filename,
     # Processing info
     reader,
     metadata,
@@ -101,225 +85,236 @@ def _generate_l0a(
     verbose,
     parallel,
 ):
-    """Generate L0A file from raw file."""
+    """Generate L0A file from raw txt file."""
     # Define product
     product = "L0A"
     # Define folder partitioning
     folder_partitioning = get_folder_partitioning()
-    # Retrieve sensor name
-    sensor_name = metadata["sensor_name"]
-    ##------------------------------------------------------------------------.
-    # Create file logger
-    filename = os.path.basename(filepath)
-    logger, logger_filepath = create_logger_file(
+    # Define product processing function
+    def core(
+        filepath,
+        reader,
+        metadata,
+        issue_dict,
+        # Archiving options
+        data_dir,
+        folder_partitioning,
+        # Processing options
+        verbose,
+        force,
+        logger,
+    ):
+        """Define L0A product processing."""
+        # Retrieve information from metadata
+        sensor_name = metadata["sensor_name"]
+        campaign_name = metadata["campaign_name"]
+        station_name = metadata["station_name"]
+        # Read raw data into L0A format
+        df = reader(filepath, logger=logger)
+        df = sanitize_df(df, sensor_name=sensor_name, verbose=verbose, issue_dict=issue_dict, logger=logger)
+        # Write L0A dataframe
+        filename = define_l0a_filename(df, campaign_name=campaign_name, station_name=station_name)
+        folder_path = define_file_folder_path(df, dir_path=data_dir, folder_partitioning=folder_partitioning)
+        out_path = os.path.join(folder_path, filename)
+        write_l0a(df, filepath=out_path, force=force, logger=logger, verbose=verbose)
+        # Return L0A dataframe
+        return df
+    # Define product processing function kwargs
+    core_func_kwargs = dict(  # noqa: C408
+        filepath=filepath,
+        reader=reader,
+        metadata=metadata,
+        issue_dict=issue_dict,
+        # Archiving options
+        data_dir=data_dir,
+        folder_partitioning=folder_partitioning,
+        # Processing options
+        verbose=verbose,
+        force=force,
+    )
+    # Run product generation
+    logger_filepath = run_product_generation(
+        product=product,
         logs_dir=logs_dir,
-        filename=filename,
+        logs_filename=logs_filename,
         parallel=parallel,
+        verbose=verbose,
+        folder_partitioning=folder_partitioning,
+        core_func=core,
+        core_func_kwargs=core_func_kwargs,
+        pass_logger=True,
     )
-    ##------------------------------------------------------------------------.
-    # Log start processing
-    msg = f"{product} processing of {filename} has started."
-    log_info(logger=logger, msg=msg, verbose=verbose)
-    ##------------------------------------------------------------------------.
-    ### - Read raw file into a dataframe and sanitize for L0A format
-    try:
-        df = reader(filepath, logger=logger)
-        df = sanitize_df(
-            df=df,
-            sensor_name=sensor_name,
-            verbose=verbose,
-            issue_dict=issue_dict,
-            logger=logger,
-        )
-        ##--------------------------------------------------------------------.
-        #### - Write to Parquet
-        filename = define_l0a_filename(df=df, campaign_name=campaign_name, station_name=station_name)
-        folder_path = define_file_folder_path(df, data_dir=data_dir, folder_partitioning=folder_partitioning)
-        filepath = os.path.join(folder_path, filename)
-        write_l0a(df=df, filepath=filepath, force=force, logger=logger, verbose=verbose)
-        ##--------------------------------------------------------------------.
-        # Clean environment
-        del df
-        # Log end processing
-        msg = f"{product} processing of {filename} has ended."
-        log_info(logger=logger, msg=msg, verbose=verbose)
-    # Otherwise log the error
-    except Exception as e:
-        error_type = str(type(e).__name__)
-        msg = f"{error_type}: {e}"
-        log_error(logger=logger, msg=msg, verbose=verbose)
-    # Close the file logger
-    close_logger(logger)
-    # Return the logger file path
     return logger_filepath
 @delayed_if_parallel
 @single_threaded_if_parallel
-def _generate_l0b(
+def _generate_l0b_from_nc(
     filepath,
     data_dir,
     logs_dir,
-    campaign_name,
-    station_name,
+    logs_filename,
     # Processing info
+    reader,
     metadata,
+    issue_dict,
     # Processing options
     force,
     verbose,
     parallel,
-    debugging_mode,
 ):
+    """Generate L0B file from raw netCDF file."""
     # Define product
     product = "L0B"
     # Define folder partitioning
     folder_partitioning = get_folder_partitioning()
-    # -----------------------------------------------------------------.
-    # Create file logger
-    filename = os.path.basename(filepath)
-    logger, logger_filepath = create_logger_file(
-        logs_dir=logs_dir,
-        filename=filename,
-        parallel=parallel,
-    )
-    ##------------------------------------------------------------------------.
-    # Log start processing
-    msg = f"{product} processing of {filename} has started."
-    log_info(logger=logger, msg=msg, verbose=verbose)
-    ##------------------------------------------------------------------------.
-    # Retrieve sensor name
-    sensor_name = metadata["sensor_name"]
-    check_sensor_name(sensor_name)
-    ##------------------------------------------------------------------------.
-    try:
-        # Read L0A Apache Parquet file
-        df = read_l0a_dataframe(filepath, logger=logger, verbose=verbose, debugging_mode=debugging_mode)
-        # -----------------------------------------------------------------.
-        # Create xarray Dataset
-        ds = create_l0b_from_l0a(df=df, metadata=metadata, logger=logger, verbose=verbose)
+    # Define product processing function
+    def core(
+        filepath,
+        reader,
+        metadata,
+        issue_dict,
+        # Dara archiving options
+        data_dir,
+        folder_partitioning,
+        # Processing options
+        verbose,
+        force,
+        logger,
+    ):
+        """Define L0B product processing."""
+        # Retrieve information from metadata
+        sensor_name = metadata["sensor_name"]
+        campaign_name = metadata["campaign_name"]
+        station_name = metadata["station_name"]
+        # Read raw netCDF and sanitize to L0B format
+        ds = reader(filepath, logger=logger)
+        ds = sanitize_ds(
+            ds=ds,
+            sensor_name=sensor_name,
+            metadata=metadata,
+            issue_dict=issue_dict,
+            verbose=verbose,
+            logger=logger,
+        )
-        # -----------------------------------------------------------------.
         # Write L0B netCDF4 dataset
         filename = define_l0b_filename(ds=ds, campaign_name=campaign_name, station_name=station_name)
-        folder_path = define_file_folder_path(ds, data_dir=data_dir, folder_partitioning=folder_partitioning)
+        folder_path = define_file_folder_path(ds, dir_path=data_dir, folder_partitioning=folder_partitioning)
         filepath = os.path.join(folder_path, filename)
-        write_l0b(ds, filepath=filepath, force=force)
-        ##--------------------------------------------------------------------.
-        # Clean environment
-        del ds, df
-        # Log end processing
-        msg = f"{product} processing of {filename} has ended."
-        log_info(logger=logger, msg=msg, verbose=verbose)
-    # Otherwise log the error
-    except Exception as e:
-        error_type = str(type(e).__name__)
-        msg = f"{error_type}: {e}"
-        log_error(logger, msg, verbose=verbose)
-    # Close the file logger
-    close_logger(logger)
-    # Return the logger file path
+        write_product(ds, filepath=filepath, force=force)
+        # Return L0B dataset
+        return ds
+    # Define product processing function kwargs
+    core_func_kwargs = dict(  # noqa: C408
+        filepath=filepath,
+        reader=reader,
+        metadata=metadata,
+        issue_dict=issue_dict,
+        # Archiving options
+        data_dir=data_dir,
+        folder_partitioning=folder_partitioning,
+        # Processing options
+        verbose=verbose,
+        force=force,
+    )
+    # Run product generation
+    logger_filepath = run_product_generation(
+        product=product,
+        logs_dir=logs_dir,
+        logs_filename=logs_filename,
+        parallel=parallel,
+        verbose=verbose,
+        folder_partitioning=folder_partitioning,
+        core_func=core,
+        core_func_kwargs=core_func_kwargs,
+        pass_logger=True,
+    )
     return logger_filepath
-def _generate_l0b_from_nc(
+@delayed_if_parallel
+@single_threaded_if_parallel
+def _generate_l0b(
     filepath,
     data_dir,
     logs_dir,
-    campaign_name,
-    station_name,
+    logs_filename,
     # Processing info
-    reader,
     metadata,
-    issue_dict,
     # Processing options
     force,
     verbose,
     parallel,
+    debugging_mode,
 ):
-    # -----------------------------------------------------------------.
-    # Define product name
+    # Define product
     product = "L0B"
     # Define folder partitioning
     folder_partitioning = get_folder_partitioning()
-    # Retrieve sensor name
-    sensor_name = metadata["sensor_name"]
+    # Define product processing function
+    def core(
+        filepath,
+        metadata,
+        # Archiving options
+        data_dir,
+        folder_partitioning,
+        # Processing options
+        debugging_mode,
+        verbose,
+        force,
+        logger,
+    ):
+        """Define L0B product processing."""
+        # Retrieve information from metadata
+        campaign_name = metadata["campaign_name"]
+        station_name = metadata["station_name"]
-    # -----------------------------------------------------------------.
-    # Create file logger
-    filename = os.path.basename(filepath)
-    logger, logger_filepath = create_logger_file(
-        logs_dir=logs_dir,
-        filename=filename,
-        parallel=parallel,
-    )
-    ##------------------------------------------------------------------------.
-    # Log start processing
-    msg = f"{product} processing of {filename} has started."
-    log_info(logger=logger, msg=msg, verbose=verbose)
-    ##------------------------------------------------------------------------.
-    ### - Read raw netCDF and sanitize for L0B format
-    try:
-        ds = reader(filepath, logger=logger)
-        ds = sanitize_ds(
-            ds=ds,
-            sensor_name=sensor_name,
-            metadata=metadata,
-            issue_dict=issue_dict,
-            verbose=verbose,
-            logger=logger,
-        )
+        # Read L0A Apache Parquet file
+        df = read_l0a_dataframe(filepath, debugging_mode=debugging_mode)
+        # Create L0B xarray Dataset
+        ds = generate_l0b(df=df, metadata=metadata, logger=logger, verbose=verbose)
-        # -----------------------------------------------------------------.
         # Write L0B netCDF4 dataset
         filename = define_l0b_filename(ds=ds, campaign_name=campaign_name, station_name=station_name)
-        folder_path = define_file_folder_path(ds, data_dir=data_dir, folder_partitioning=folder_partitioning)
+        folder_path = define_file_folder_path(ds, dir_path=data_dir, folder_partitioning=folder_partitioning)
         filepath = os.path.join(folder_path, filename)
-        write_l0b(ds, filepath=filepath, force=force)
-        ##--------------------------------------------------------------------.
-        # Clean environment
-        del ds
-        # Log end processing
-        msg = f"L0B processing of {filename} has ended."
-        log_info(logger=logger, msg=msg, verbose=verbose)
-    # Otherwise log the error
-    except Exception as e:
-        error_type = str(type(e).__name__)
-        msg = f"{error_type}: {e}"
-        log_error(logger, msg, verbose=verbose)
-    # Close the file logger
-    close_logger(logger)
+        write_product(ds, filepath=filepath, force=force)
+        # Return L0B dataset
+        return ds
+    # Define product processing function kwargs
+    core_func_kwargs = dict(  # noqa: C408
+        filepath=filepath,
+        metadata=metadata,
+        # Archiving options
+        data_dir=data_dir,
+        folder_partitioning=folder_partitioning,
+        # Processing options
+        debugging_mode=debugging_mode,
+        verbose=verbose,
+        force=force,
+    )
+    # Run product generation
+    logger_filepath = run_product_generation(
+        product=product,
+        logs_dir=logs_dir,
+        logs_filename=logs_filename,
+        parallel=parallel,
+        verbose=verbose,
+        folder_partitioning=folder_partitioning,
+        core_func=core,
+        core_func_kwargs=core_func_kwargs,
+        pass_logger=True,
+    )
     # Return the logger file path
     return logger_filepath
@@ -327,93 +322,93 @@ def _generate_l0b_from_nc(
 @delayed_if_parallel
 @single_threaded_if_parallel
 def _generate_l0c(
-    day,
-    filepaths,
+    event_info,
     data_dir,
     logs_dir,
-    metadata_filepath,
-    campaign_name,
-    station_name,
+    logs_filename,
+    # Processing info
+    metadata,
     # Processing options
     force,
     verbose,
     parallel,  # this is used only to initialize the correct logger !
 ):
-    # -----------------------------------------------------------------.
-    # Define product name
+    """Define L0C product processing."""
+    # Define product
     product = "L0C"
     # Define folder partitioning
     folder_partitioning = get_folder_partitioning()
-    # -----------------------------------------------------------------.
-    # Create file logger
-    logger, logger_filepath = create_logger_file(
-        logs_dir=logs_dir,
-        filename=day,
-        parallel=parallel,
-    )
-    ##------------------------------------------------------------------------.
-    # Log start processing
-    msg = f"{product} processing for {day} has started."
-    log_info(logger=logger, msg=msg, verbose=verbose)
-    ##------------------------------------------------------------------------.
-    ### Core computation
-    try:
-        # Retrieve measurement_intervals
-        # - TODO: in future available from dataset
-        metadata = read_yaml(metadata_filepath)
-        measurement_intervals = retrieve_possible_measurement_intervals(metadata)
+    # Define product processing function
+    def core(
+        event_info,
+        metadata,
+        # Archiving options
+        data_dir,
+        folder_partitioning,
+        # Processing options
+        verbose,
+        force,
+        logger,
+    ):
+        """Define L0C product processing."""
+        # Retrieve information from metadata
+        sensor_name = metadata["sensor_name"]
+        campaign_name = metadata["campaign_name"]
+        station_name = metadata["station_name"]
+        measurement_intervals = check_measurement_intervals(metadata["measurement_interval"])
         # Produce L0C datasets
-        dict_ds = create_daily_file(
-            day=day,
-            filepaths=filepaths,
+        dict_ds = create_l0c_datasets(
+            event_info=event_info,
             measurement_intervals=measurement_intervals,
+            sensor_name=sensor_name,
             ensure_variables_equality=True,
             logger=logger,
             verbose=verbose,
         )
         # Write a dataset for each sample interval
+        valid_datasets = []
         for ds in dict_ds.values():  # (sample_interval, ds)
             # Write L0C netCDF4 dataset
             if ds["time"].size > 1:
-                # Get sensor name from dataset
-                sensor_name = ds.attrs.get("sensor_name")
-                campaign_name = ds.attrs.get("campaign_name")
-                station_name = ds.attrs.get("station_name")
-                # Set encodings
-                ds = set_l0b_encodings(ds=ds, sensor_name=sensor_name)
-                # Define filepath
+                # Write L0C netCDF4 dataset
                 filename = define_l0c_filename(ds, campaign_name=campaign_name, station_name=station_name)
-                folder_path = define_file_folder_path(ds, data_dir=data_dir, folder_partitioning=folder_partitioning)
+                folder_path = define_file_folder_path(ds, dir_path=data_dir, folder_partitioning=folder_partitioning)
                 filepath = os.path.join(folder_path, filename)
+                write_product(ds, filepath=filepath, force=force)
+                valid_datasets.append(ds)
+        # Return a valid L0C dataset (just for logging)
+        if len(valid_datasets) == 0:
+            return None  # can happen when e.g. for a day there is not data (but input filepaths of previous/next day)
+        return valid_datasets[0]
+    # Define product processing function kwargs
+    core_func_kwargs = dict(  # noqa: C408
+        event_info=event_info,
+        metadata=metadata,
+        # Archiving options
+        data_dir=data_dir,
+        folder_partitioning=folder_partitioning,
+        # Processing options
+        verbose=verbose,
+        force=force,
+    )
-                # Write to disk
-                write_product(ds, product=product, filepath=filepath, force=force)
-        # Clean environment
-        del ds
-        # Log end processing
-        msg = f"{product} processing for {day} has ended."
-        log_info(logger=logger, msg=msg, verbose=verbose)
-    ##--------------------------------------------------------------------.
-    # Otherwise log the error
-    except Exception as e:
-        error_type = str(type(e).__name__)
-        msg = f"{error_type}: {e}"
-        log_error(logger, msg, verbose=verbose)
-    # Close the file logger
-    close_logger(logger)
+    # Run product generation
+    logger_filepath = run_product_generation(
+        product=product,
+        logs_dir=logs_dir,
+        logs_filename=logs_filename,
+        parallel=parallel,
+        verbose=verbose,
+        folder_partitioning=folder_partitioning,
+        core_func=core,
+        core_func_kwargs=core_func_kwargs,
+        pass_logger=True,
+    )
     # Return the logger file path
     return logger_filepath
@@ -474,6 +469,15 @@ def run_l0a_station(
     data_archive_dir = get_data_archive_dir(data_archive_dir)
     metadata_archive_dir = get_metadata_archive_dir(metadata_archive_dir)
+    # Check valid data_source, campaign_name, and station_name
+    check_station_inputs(
+        metadata_archive_dir=metadata_archive_dir,
+        data_source=data_source,
+        campaign_name=campaign_name,
+        station_name=station_name,
+    )
+    # ------------------------------------------------------------------------.
     # Read metadata
     metadata = read_station_metadata(
         metadata_archive_dir=metadata_archive_dir,
@@ -503,11 +507,11 @@ def run_l0a_station(
     # Create directory structure
     data_dir = create_l0_directory_structure(
         data_archive_dir=data_archive_dir,
+        metadata_archive_dir=metadata_archive_dir,
         data_source=data_source,
         campaign_name=campaign_name,
-        metadata_archive_dir=metadata_archive_dir,
-        product=product,  # L0A or L0B
         station_name=station_name,
+        product=product,  # L0A or L0B
         force=force,
     )
@@ -571,8 +575,7 @@ def run_l0a_station(
             filepath=filepath,
             data_dir=data_dir,
             logs_dir=logs_dir,
-            campaign_name=campaign_name,
-            station_name=station_name,
+            logs_filename=os.path.basename(filepath),
             # Reader argument
             reader=reader,
             # Processing info
@@ -585,7 +588,7 @@ def run_l0a_station(
         )
         for filepath in filepaths
     ]
-    list_logs = dask.compute(*list_tasks) if parallel else list_tasks
+    list_logs = execute_tasks_safely(list_tasks=list_tasks, parallel=parallel, logs_dir=logs_dir)
     # -----------------------------------------------------------------.
     # Define product summary logs
@@ -652,7 +655,7 @@ def run_l0b_station(
         and multi-threading will be automatically exploited to speed up I/O tasks.
     debugging_mode : bool, optional
         If ``True``, the amount of data processed will be reduced.
-        Only the first 100 rows of 3 L0A files will be processed. The default value is ``False``.
+        Only 100 rows sampled from 3 L0A files will be processed. The default value is ``False``.
     remove_l0a: bool, optional
         Whether to remove the processed L0A files. The default value is ``False``.
     data_archive_dir : str, optional
@@ -669,6 +672,13 @@ def run_l0b_station(
     # Retrieve DISDRODB Metadata Archive directory
     metadata_archive_dir = get_metadata_archive_dir(metadata_archive_dir)
+    # Check valid data_source, campaign_name, and station_name
+    check_station_inputs(
+        metadata_archive_dir=metadata_archive_dir,
+        data_source=data_source,
+        campaign_name=campaign_name,
+        station_name=station_name,
+    )
     # -----------------------------------------------------------------.
     # Retrieve metadata
     metadata = read_station_metadata(
@@ -711,30 +721,19 @@ def run_l0b_station(
     )
     ##----------------------------------------------------------------.
-    # Get L0A files for the station
+    # List files to process
+    # - If no data available, print error message and return None
     required_product = get_required_product(product)
-    flag_not_available_data = False
-    try:
-        filepaths = find_files(
-            data_archive_dir=data_archive_dir,
-            data_source=data_source,
-            campaign_name=campaign_name,
-            station_name=station_name,
-            product=required_product,
-            debugging_mode=debugging_mode,
-        )
-    except Exception as e:
-        print(str(e))  # Case where no file paths available
-        flag_not_available_data = True
-    # -------------------------------------------------------------------------.
-    # If no data available, print error message and return None
-    if flag_not_available_data:
-        msg = (
-            f"{product} processing of {data_source} {campaign_name} {station_name}"
-            + f"has not been launched because of missing {required_product} data."
-        )
-        print(msg)
+    filepaths = try_get_required_filepaths(
+        data_archive_dir=data_archive_dir,
+        data_source=data_source,
+        campaign_name=campaign_name,
+        station_name=station_name,
+        product=required_product,
+        # Processing options
+        debugging_mode=debugging_mode,
+    )
+    if filepaths is None:
         return
     ##----------------------------------------------------------------.
@@ -743,16 +742,13 @@ def run_l0b_station(
     # - If parallel=True, it does that in parallel using dask.bag
     #   Settings npartitions=len(filepaths) enable to wait prior task on a core
     #   finish before starting a new one.
-    # BUG: If debugging_mode=True and parallel=True a subtle bug can currently occur when
-    #   two processes with a subsetted L0A files want to create the same L0B files !
     list_tasks = [
         _generate_l0b(
             filepath=filepath,
             data_dir=data_dir,
             logs_dir=logs_dir,
+            logs_filename=os.path.basename(filepath),
             metadata=metadata,
-            campaign_name=campaign_name,
-            station_name=station_name,
             force=force,
             verbose=verbose,
             debugging_mode=debugging_mode,
@@ -760,38 +756,8 @@ def run_l0b_station(
         )
         for filepath in filepaths
     ]
-    list_logs = dask.compute(*list_tasks) if parallel else list_tasks
-    # if not parallel:
-    #     list_logs = [
-    #         _generate_l0b(
-    #             filepath=filepath,
-    #             data_dir=data_dir,
-    #             logs_dir=logs_dir,
-    #             metadata=metadata,
-    #             campaign_name=campaign_name,
-    #             station_name=station_name,
-    #             force=force,
-    #             verbose=verbose,
-    #             debugging_mode=debugging_mode,
-    #             parallel=parallel,
-    #         )
-    #         for filepath in filepaths
-    #     ]
-    # else:
-    #     bag = db.from_sequence(filepaths, npartitions=len(filepaths))
-    #     list_logs = bag.map(
-    #         _generate_l0b,
-    #         data_dir=data_dir,
-    #         logs_dir=logs_dir,
-    #         metadata=metadata,
-    #         campaign_name=campaign_name,
-    #         station_name=station_name,
-    #         force=force,
-    #         verbose=verbose,
-    #         debugging_mode=debugging_mode,
-    #         parallel=parallel,
-    #     ).compute()
+    list_logs = execute_tasks_safely(list_tasks=list_tasks, parallel=parallel, logs_dir=logs_dir)
     # -----------------------------------------------------------------.
     # Define L0B summary logs
@@ -899,6 +865,23 @@ def run_l0c_station(
     # Retrieve DISDRODB Metadata Archive directory
     metadata_archive_dir = get_metadata_archive_dir(metadata_archive_dir)
+    # Check valid data_source, campaign_name, and station_name
+    check_station_inputs(
+        metadata_archive_dir=metadata_archive_dir,
+        data_source=data_source,
+        campaign_name=campaign_name,
+        station_name=station_name,
+    )
+    # -----------------------------------------------------------------.
+    # Retrieve metadata
+    metadata = read_station_metadata(
+        metadata_archive_dir=metadata_archive_dir,
+        data_source=data_source,
+        campaign_name=campaign_name,
+        station_name=station_name,
+    )
     # ------------------------------------------------------------------------.
     # Start processing
     t_i = time.time()
@@ -926,46 +909,26 @@ def run_l0c_station(
         force=force,
     )
-    # ------------------------------------------------------------------------.
-    # Define metadata filepath
-    metadata_filepath = define_metadata_filepath(
-        metadata_archive_dir=metadata_archive_dir,
+    # -------------------------------------------------------------------------.
+    # List files to process
+    # - If no data available, print error message and return None
+    required_product = get_required_product(product)
+    filepaths = try_get_required_filepaths(
+        data_archive_dir=data_archive_dir,
         data_source=data_source,
         campaign_name=campaign_name,
         station_name=station_name,
+        product=required_product,
+        # Processing options
+        debugging_mode=debugging_mode,
     )
-    # -------------------------------------------------------------------------.
-    # List files to process
-    required_product = get_required_product(product)
-    flag_not_available_data = False
-    try:
-        filepaths = find_files(
-            data_archive_dir=data_archive_dir,
-            data_source=data_source,
-            campaign_name=campaign_name,
-            station_name=station_name,
-            product=required_product,
-            # Processing options
-            debugging_mode=debugging_mode,
-        )
-    except Exception as e:
-        print(str(e))  # Case where no file paths available
-        flag_not_available_data = True
-    # -------------------------------------------------------------------------.
-    # If no data available, print error message and return None
-    if flag_not_available_data:
-        msg = (
-            f"{product} processing of {data_source} {campaign_name} {station_name}"
-            + f"has not been launched because of missing {required_product} data."
-        )
-        print(msg)
+    if filepaths is None:
         return
     # -------------------------------------------------------------------------.
-    # Retrieve dictionary with the required files for each day.
-    dict_days_files = get_files_per_days(filepaths)
+    # Retrieve dictionary with the required files per time block
+    # TODO: allow customizing this in config file, but risk of out of memory !
+    list_event_info = get_files_per_time_block(filepaths=filepaths, freq="day", tolerance_seconds=TOLERANCE_SECONDS)
     # -----------------------------------------------------------------.
     # Generate L0C files
@@ -973,21 +936,19 @@ def run_l0c_station(
     # - If parallel=True, it does that in parallel using dask.delayed
     list_tasks = [
         _generate_l0c(
-            day=day,
-            filepaths=filepaths,
+            event_info=event_info,
+            metadata=metadata,
             data_dir=data_dir,
             logs_dir=logs_dir,
-            metadata_filepath=metadata_filepath,
-            campaign_name=campaign_name,
-            station_name=station_name,
+            logs_filename=event_info["start_time"].strftime("%Y%m%dT%H%M%S"),
             # Processing options
             force=force,
             verbose=verbose,
             parallel=parallel,
         )
-        for day, filepaths in dict_days_files.items()
+        for event_info in list_event_info
     ]
-    list_logs = dask.compute(*list_tasks) if parallel else list_tasks
+    list_logs = execute_tasks_safely(list_tasks=list_tasks, parallel=parallel, logs_dir=logs_dir)
     # -----------------------------------------------------------------.
     # Define summary logs

disdrodb 0.1.2__py3-none-any.whl → 0.1.4__py3-none-any.whl

disdrodb 0.1.2py3-none-any.whl → 0.1.4py3-none-any.whl