PyPI - cloudnetpy - Versions diffs - 1.49.9__py3-none-any.whl → 1.87.3__py3-none-any.whl - Mend

cloudnetpy 1.49.9py3-none-any.whl → 1.87.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (116) hide show

cloudnetpy/categorize/__init__.py +1 -2
cloudnetpy/categorize/atmos_utils.py +297 -67
cloudnetpy/categorize/attenuation.py +31 -0
cloudnetpy/categorize/attenuations/__init__.py +37 -0
cloudnetpy/categorize/attenuations/gas_attenuation.py +30 -0
cloudnetpy/categorize/attenuations/liquid_attenuation.py +84 -0
cloudnetpy/categorize/attenuations/melting_attenuation.py +78 -0
cloudnetpy/categorize/attenuations/rain_attenuation.py +84 -0
cloudnetpy/categorize/categorize.py +332 -156
cloudnetpy/categorize/classify.py +127 -125
cloudnetpy/categorize/containers.py +107 -76
cloudnetpy/categorize/disdrometer.py +40 -0
cloudnetpy/categorize/droplet.py +23 -21
cloudnetpy/categorize/falling.py +53 -24
cloudnetpy/categorize/freezing.py +25 -12
cloudnetpy/categorize/insects.py +35 -23
cloudnetpy/categorize/itu.py +243 -0
cloudnetpy/categorize/lidar.py +36 -41
cloudnetpy/categorize/melting.py +34 -26
cloudnetpy/categorize/model.py +84 -37
cloudnetpy/categorize/mwr.py +18 -14
cloudnetpy/categorize/radar.py +215 -102
cloudnetpy/cli.py +578 -0
cloudnetpy/cloudnetarray.py +43 -89
cloudnetpy/concat_lib.py +218 -78
cloudnetpy/constants.py +28 -10
cloudnetpy/datasource.py +61 -86
cloudnetpy/exceptions.py +49 -20
cloudnetpy/instruments/__init__.py +5 -0
cloudnetpy/instruments/basta.py +29 -12
cloudnetpy/instruments/bowtie.py +135 -0
cloudnetpy/instruments/ceilo.py +138 -115
cloudnetpy/instruments/ceilometer.py +164 -80
cloudnetpy/instruments/cl61d.py +21 -5
cloudnetpy/instruments/cloudnet_instrument.py +74 -36
cloudnetpy/instruments/copernicus.py +108 -30
cloudnetpy/instruments/da10.py +54 -0
cloudnetpy/instruments/disdrometer/common.py +126 -223
cloudnetpy/instruments/disdrometer/parsivel.py +453 -94
cloudnetpy/instruments/disdrometer/thies.py +254 -87
cloudnetpy/instruments/fd12p.py +201 -0
cloudnetpy/instruments/galileo.py +65 -23
cloudnetpy/instruments/hatpro.py +123 -49
cloudnetpy/instruments/instruments.py +113 -1
cloudnetpy/instruments/lufft.py +39 -17
cloudnetpy/instruments/mira.py +268 -61
cloudnetpy/instruments/mrr.py +187 -0
cloudnetpy/instruments/nc_lidar.py +19 -8
cloudnetpy/instruments/nc_radar.py +109 -55
cloudnetpy/instruments/pollyxt.py +135 -51
cloudnetpy/instruments/radiometrics.py +313 -59
cloudnetpy/instruments/rain_e_h3.py +171 -0
cloudnetpy/instruments/rpg.py +321 -189
cloudnetpy/instruments/rpg_reader.py +74 -40
cloudnetpy/instruments/toa5.py +49 -0
cloudnetpy/instruments/vaisala.py +95 -343
cloudnetpy/instruments/weather_station.py +774 -105
cloudnetpy/metadata.py +90 -19
cloudnetpy/model_evaluation/file_handler.py +55 -52
cloudnetpy/model_evaluation/metadata.py +46 -20
cloudnetpy/model_evaluation/model_metadata.py +1 -1
cloudnetpy/model_evaluation/plotting/plot_tools.py +32 -37
cloudnetpy/model_evaluation/plotting/plotting.py +327 -117
cloudnetpy/model_evaluation/products/advance_methods.py +92 -83
cloudnetpy/model_evaluation/products/grid_methods.py +88 -63
cloudnetpy/model_evaluation/products/model_products.py +43 -35
cloudnetpy/model_evaluation/products/observation_products.py +41 -35
cloudnetpy/model_evaluation/products/product_resampling.py +17 -7
cloudnetpy/model_evaluation/products/tools.py +29 -20
cloudnetpy/model_evaluation/statistics/statistical_methods.py +30 -20
cloudnetpy/model_evaluation/tests/e2e/conftest.py +3 -3
cloudnetpy/model_evaluation/tests/e2e/process_cf/main.py +9 -5
cloudnetpy/model_evaluation/tests/e2e/process_cf/tests.py +15 -14
cloudnetpy/model_evaluation/tests/e2e/process_iwc/main.py +9 -5
cloudnetpy/model_evaluation/tests/e2e/process_iwc/tests.py +15 -14
cloudnetpy/model_evaluation/tests/e2e/process_lwc/main.py +9 -5
cloudnetpy/model_evaluation/tests/e2e/process_lwc/tests.py +15 -14
cloudnetpy/model_evaluation/tests/unit/conftest.py +42 -41
cloudnetpy/model_evaluation/tests/unit/test_advance_methods.py +41 -48
cloudnetpy/model_evaluation/tests/unit/test_grid_methods.py +216 -194
cloudnetpy/model_evaluation/tests/unit/test_model_products.py +23 -21
cloudnetpy/model_evaluation/tests/unit/test_observation_products.py +37 -38
cloudnetpy/model_evaluation/tests/unit/test_plot_tools.py +43 -40
cloudnetpy/model_evaluation/tests/unit/test_plotting.py +30 -36
cloudnetpy/model_evaluation/tests/unit/test_statistical_methods.py +68 -31
cloudnetpy/model_evaluation/tests/unit/test_tools.py +33 -26
cloudnetpy/model_evaluation/utils.py +2 -1
cloudnetpy/output.py +170 -111
cloudnetpy/plotting/__init__.py +2 -1
cloudnetpy/plotting/plot_meta.py +562 -822
cloudnetpy/plotting/plotting.py +1142 -704
cloudnetpy/products/__init__.py +1 -0
cloudnetpy/products/classification.py +370 -88
cloudnetpy/products/der.py +85 -55
cloudnetpy/products/drizzle.py +77 -34
cloudnetpy/products/drizzle_error.py +15 -11
cloudnetpy/products/drizzle_tools.py +79 -59
cloudnetpy/products/epsilon.py +211 -0
cloudnetpy/products/ier.py +27 -50
cloudnetpy/products/iwc.py +55 -48
cloudnetpy/products/lwc.py +96 -70
cloudnetpy/products/mwr_tools.py +186 -0
cloudnetpy/products/product_tools.py +170 -128
cloudnetpy/utils.py +455 -240
cloudnetpy/version.py +2 -2
{cloudnetpy-1.49.9.dist-info → cloudnetpy-1.87.3.dist-info}/METADATA +44 -40
cloudnetpy-1.87.3.dist-info/RECORD +127 -0
{cloudnetpy-1.49.9.dist-info → cloudnetpy-1.87.3.dist-info}/WHEEL +1 -1
cloudnetpy-1.87.3.dist-info/entry_points.txt +2 -0
docs/source/conf.py +2 -2
cloudnetpy/categorize/atmos.py +0 -361
cloudnetpy/products/mwr_multi.py +0 -68
cloudnetpy/products/mwr_single.py +0 -75
cloudnetpy-1.49.9.dist-info/RECORD +0 -112
{cloudnetpy-1.49.9.dist-info → cloudnetpy-1.87.3.dist-info/licenses}/LICENSE +0 -0
{cloudnetpy-1.49.9.dist-info → cloudnetpy-1.87.3.dist-info}/top_level.txt +0 -0

cloudnetpy/instruments/disdrometer/parsivel.py CHANGED Viewed

@@ -1,34 +1,42 @@
+import csv
 import datetime
 import logging
-from collections.abc import Callable, Iterator, Sequence
+import re
+from collections import defaultdict
+from collections.abc import Callable, Iterable, Iterator, Sequence
 from itertools import islice
-from pathlib import Path
-from typing import Any, Literal
+from os import PathLike
+from typing import Any
+from uuid import UUID
 import numpy as np
+import numpy.typing as npt
+from numpy import ma
 from cloudnetpy import output
 from cloudnetpy.cloudnetarray import CloudnetArray
+from cloudnetpy.constants import MM_TO_M, SEC_IN_HOUR
 from cloudnetpy.exceptions import DisdrometerDataError
 from cloudnetpy.instruments import instruments
-from cloudnetpy.instruments.cloudnet_instrument import CloudnetInstrument
+from cloudnetpy.utils import get_uuid
 from .common import ATTRIBUTES, Disdrometer
 def parsivel2nc(
-    disdrometer_file: Path | str | bytes,
-    output_file: str,
+    disdrometer_file: str | PathLike | Iterable[str | PathLike],
+    output_file: str | PathLike,
     site_meta: dict,
-    uuid: str | None = None,
+    uuid: str | UUID | None = None,
     date: str | datetime.date | None = None,
     telegram: Sequence[int | None] | None = None,
-) -> str:
+    timestamps: Sequence[datetime.datetime] | None = None,
+) -> UUID:
     """Converts OTT Parsivel-2 disdrometer data into Cloudnet Level 1b netCDF
     file.
     Args:
-        disdrometer_file: Filename of disdrometer .log file.
+        disdrometer_file: Filename of disdrometer file or list of filenames.
         output_file: Output filename.
         site_meta: Dictionary containing information about the site. Required key
             is `name`.
@@ -38,6 +46,7 @@ def parsivel2nc(
             the instrument's operating instructions. Unknown values are indicated
             with None. Telegram is required if the input file doesn't contain a
             header.
+        timestamps: Specify list of timestamps if they are missing in the input file.
     Returns:
         UUID of the generated file.
@@ -55,28 +64,36 @@ def parsivel2nc(
     """
     if isinstance(date, str):
         date = datetime.date.fromisoformat(date)
-    disdrometer = Parsivel(disdrometer_file, site_meta, telegram, date)
+    uuid = get_uuid(uuid)
+    if isinstance(disdrometer_file, str | PathLike):
+        disdrometer_file = [disdrometer_file]
+    disdrometer = Parsivel(disdrometer_file, site_meta, telegram, date, timestamps)
     disdrometer.sort_timestamps()
     disdrometer.remove_duplicate_timestamps()
+    disdrometer.mask_invalid_values()
+    if len(disdrometer.data["time"].data) < 2:
+        msg = "Too few data points"
+        raise DisdrometerDataError(msg)
     disdrometer.convert_units()
     disdrometer.add_meta()
     attributes = output.add_time_attribute(ATTRIBUTES, disdrometer.date)
     output.update_attributes(disdrometer.data, attributes)
-    uuid = output.save_level1b(disdrometer, output_file, uuid)
+    output.save_level1b(disdrometer, output_file, uuid)
     return uuid
-class Parsivel(CloudnetInstrument):
+class Parsivel(Disdrometer):
     def __init__(
         self,
-        filename: Path | str | bytes,
+        filenames: Iterable[str | PathLike],
         site_meta: dict,
         telegram: Sequence[int | None] | None = None,
         expected_date: datetime.date | None = None,
-    ):
+        timestamps: Sequence[datetime.datetime] | None = None,
+    ) -> None:
         super().__init__()
         self.site_meta = site_meta
-        self.raw_data = _read_parsivel(filename, telegram)
+        self.raw_data = _read_parsivel(filenames, telegram, timestamps)
         self._screen_time(expected_date)
         self.n_velocity = 32
         self.n_diameter = 32
@@ -87,89 +104,74 @@ class Parsivel(CloudnetInstrument):
         self._create_velocity_vectors()
         self._create_diameter_vectors()
-    def _screen_time(self, expected_date: datetime.date | None = None):
+    def _screen_time(self, expected_date: datetime.date | None = None) -> None:
         if expected_date is None:
             self.date = self.raw_data["time"][0].astype(object).date()
             return
         self.date = expected_date
         valid_mask = self.raw_data["time"].astype("datetime64[D]") == self.date
         if np.count_nonzero(valid_mask) == 0:
-            raise DisdrometerDataError(f"No data found on {expected_date}")
+            msg = f"No data found on {expected_date}"
+            raise DisdrometerDataError(msg)
         for key in self.raw_data:
             self.raw_data[key] = self.raw_data[key][valid_mask]
-    def _append_data(self):
+    def _append_data(self) -> None:
         for key, values in self.raw_data.items():
             if key.startswith("_"):
                 continue
+            name = key
+            values_out = values
             match key:
                 case "spectrum":
-                    key = "data_raw"
+                    name = "data_raw"
                     dimensions = ["time", "diameter", "velocity"]
                 case "number_concentration" | "fall_velocity":
                     dimensions = ["time", "diameter"]
                 case "time":
                     dimensions = []
                     base = values[0].astype("datetime64[D]")
-                    values = (values - base) / np.timedelta64(1, "h")
+                    values_out = (values - base) / np.timedelta64(1, "h")
                 case _:
                     dimensions = ["time"]
-            self.data[key] = CloudnetArray(values, key, dimensions=dimensions)
+            self.data[name] = CloudnetArray(values_out, name, dimensions=dimensions)
         if "_sensor_id" in self.raw_data:
             first_id = self.raw_data["_sensor_id"][0]
             for sensor_id in self.raw_data["_sensor_id"]:
                 if sensor_id != first_id:
-                    raise DisdrometerDataError("Multiple sensor IDs are not supported")
+                    msg = "Multiple sensor IDs are not supported"
+                    raise DisdrometerDataError(msg)
             self.serial_number = first_id
-    def _create_velocity_vectors(self):
+    def _create_velocity_vectors(self) -> None:
         n_values = [10, 5, 5, 5, 5, 2]
         spreads = [0.1, 0.2, 0.4, 0.8, 1.6, 3.2]
-        Disdrometer.store_vectors(self.data, n_values, spreads, "velocity")
+        self.store_vectors(n_values, spreads, "velocity")
-    def _create_diameter_vectors(self):
+    def _create_diameter_vectors(self) -> None:
         n_values = [10, 5, 5, 5, 5, 2]
         spreads = [0.125, 0.25, 0.5, 1, 2, 3]
-        Disdrometer.store_vectors(self.data, n_values, spreads, "diameter")
+        self.store_vectors(n_values, spreads, "diameter")
+    def mask_invalid_values(self) -> None:
+        if variable := self.data.get("number_concentration"):
+            variable.data = ma.masked_where(variable.data == -9.999, variable.data)
+        if variable := self.data.get("fall_velocity"):
+            variable.data = ma.masked_where(variable.data == 0, variable.data)
-    def convert_units(self):
-        mm_to_m = 1e3
-        mmh_to_ms = 3600 * mm_to_m
+    def convert_units(self) -> None:
+        mmh_to_ms = SEC_IN_HOUR / MM_TO_M
         c_to_k = 273.15
         self._convert_data(("rainfall_rate",), mmh_to_ms)
         self._convert_data(("snowfall_rate",), mmh_to_ms)
-        self._convert_data(("diameter", "diameter_spread", "diameter_bnds"), mm_to_m)
+        self._convert_data(("diameter", "diameter_spread", "diameter_bnds"), 1e3)
         self._convert_data(("V_sensor_supply",), 10)
         self._convert_data(("T_sensor",), c_to_k, method="add")
+        if variable := self.data.get("number_concentration"):
+            variable.data = np.power(10, variable.data).round().astype(np.uint32)
-    def add_meta(self):
-        valid_keys = ("latitude", "longitude", "altitude")
-        for key, value in self.site_meta.items():
-            key = key.lower()
-            if key in valid_keys:
-                self.data[key] = CloudnetArray(float(value), key)
-    def _convert_data(
-        self,
-        keys: tuple[str, ...],
-        value: float,
-        method: Literal["divide", "add"] = "divide",
-    ):
-        for key in keys:
-            if key not in self.data:
-                continue
-            variable = self.data[key]
-            if method == "divide":
-                variable.data = variable.data.astype("f4") / value
-                variable.data_type = "f4"
-            elif method == "add":
-                variable.data = variable.data.astype("f4") + value
-                variable.data_type = "f4"
-            else:
-                raise ValueError
-HEADERS = {
+CSV_HEADERS = {
     "Date": "_date",
     "Time": "_time",
     "Intensity of precipitation (mm/h)": "rainfall_rate",
@@ -190,6 +192,86 @@ HEADERS = {
     "Spectrum": "spectrum",
 }
+TOA5_HEADERS = {
+    "RECORD": "_record",
+    "TIMESTAMP": "_datetime",
+    "datetime_utc": "_datetime",
+    "rainIntensity": "rainfall_rate",
+    "rain_intensity": "rainfall_rate",
+    "rain rate [mm/h]": "rainfall_rate",
+    "snowIntensity": "snowfall_rate",
+    "snow_intensity": "snowfall_rate",
+    "accPrec": "_rain_accum",
+    "precipitation": "_rain_accum",
+    "rain accum [mm]": "_rain_accum",
+    "weatherCodeWaWa": "synop_WaWa",
+    "wawa": "synop_WaWa",
+    "weather_code_wawa": "synop_WaWa",
+    "radarReflectivity": "radar_reflectivity",
+    "radar_reflectivity": "radar_reflectivity",
+    "Z [dBz]": "radar_reflectivity",
+    "morVisibility": "visibility",
+    "mor_visibility": "visibility",
+    "MOR visibility [m]": "visibility",
+    "kineticEnergy": "kinetic_energy",
+    "kinetic_energy": "kinetic_energy",
+    "signalAmplitude": "sig_laser",
+    "signal_amplitude": "sig_laser",
+    "Signal amplitude": "sig_laser",
+    "sensorTemperature": "T_sensor",
+    "sensor_temperature": "T_sensor",
+    "Temperature sensor [°C]": "T_sensor",
+    "pbcTemperature": "_T_pcb",
+    "pbc_temperature": "_T_pcb",
+    "rightTemperature": "_T_right",
+    "right_temperature": "_T_right",
+    "leftTemperature": "_T_left",
+    "left_temperature": "_T_left",
+    "heatingCurrent": "I_heating",
+    "heating_current": "I_heating",
+    "sensorVoltage": "V_power_supply",
+    "sensor_voltage": "V_power_supply",
+    "Power supply voltage in the sensor [V]": "V_power_supply",
+    "sensorStatus": "state_sensor",
+    "sensor_status": "state_sensor",
+    "Sensor status": "state_sensor",
+    "errorCode": "error_code",
+    "error_code": "error_code",
+    "Error code": "error_code",
+    "numberParticles": "n_particles",
+    "number_particles": "n_particles",
+    "Number of detected particles": "n_particles",
+    "N": "number_concentration",
+    "V": "fall_velocity",
+    "spectrum": "spectrum",
+    "Current heating system [A]": "I_heating",
+    "sample interval [s]": "interval",
+    "Serial number": "_sensor_id",
+    "IOP firmware version": "_iop_firmware_version",
+    "Station name": "_station_name",
+    "Rain amount absolute [mm]": "_rain_amount_absolute",
+    # Kenttärova
+    "wawa [ww]": "synop_WW",
+    "wawa [METAR]": "_metar_speci",
+    "wawa [NWS]": "_nws",
+    "DSP firmware version": "_dsp_firmware_version",
+    "Start of measurement [DD.MM.YY_HH:MM:SS]": "_datetime_skip",
+    "Sensor time [HH:MM:SS]": "_time_skip",
+    "Sensor date [DD.MM.YY]": "_date_skip",
+    "Station number": "_station_number",
+    "Temperature PCB [°C]": "_T_pcb",
+    "Temperature right sensor head [°C]": "_T_right",
+    "Temperature left sensor head [°C]": "_T_left",
+    "Rain intensity 16 bit low [mm/h]": "_rainfall_rate_16_bit_low",
+    "Rain intensity 16 bit high [mm/h]": "_rainfall_rate_16_bit_high",
+    "Rain accumulated 16 bit [mm]": "_rain_accum_16_bit",
+    "Reflectivity 16 bit [dBZ]": "_radar_reflectivity_16_bit",
+    "Kinetic energy [J m-2 h-1)]": "kinetic_energy",
+    "Snow depth intensity (vol equiv.) [mm/h]": "snowfall_rate",
+    "Number of particles": "n_particles",
+    "Particle list (empty, see particle file)": "_particles",
+}
 TELEGRAM = {
     1: "rainfall_rate",
     2: "_rain_accum",
@@ -249,9 +331,11 @@ def _parse_date(tokens: Iterator[str]) -> datetime.date:
     elif "." in token:
         day, month, year = token.split(".")
     else:
-        raise ValueError(f"Unsupported date: '{input}'")
+        msg = f"Unsupported date: '{input}'"
+        raise ValueError(msg)
     if len(year) != 4:
-        raise ValueError(f"Unsupported date: '{input}'")
+        msg = f"Unsupported date: '{input}'"
+        raise ValueError(msg)
     return datetime.date(int(year), int(month), int(day))
@@ -269,14 +353,21 @@ def _parse_datetime(tokens: Iterator[str]) -> datetime.datetime:
     hour = int(token[8:10])
     minute = int(token[10:12])
     second = int(token[12:14])
-    return datetime.datetime(year, month, day, hour, minute, second)
+    return datetime.datetime(
+        year,
+        month,
+        day,
+        hour,
+        minute,
+        second,
+    )
-def _parse_vector(tokens: Iterator[str]) -> np.ndarray:
+def _parse_vector(tokens: Iterator[str]) -> npt.NDArray:
     return np.array([_parse_float(tokens) for _i in range(32)])
-def _parse_spectrum(tokens: Iterator[str]) -> np.ndarray:
+def _parse_spectrum(tokens: Iterator[str]) -> npt.NDArray:
     first = next(tokens)
     if first == "<SPECTRUM>ZERO</SPECTRUM>":
         return np.zeros((32, 32), dtype="i2")
@@ -284,17 +375,24 @@ def _parse_spectrum(tokens: Iterator[str]) -> np.ndarray:
         raw = [first.removeprefix("<SPECTRUM>")]
         raw.extend(islice(tokens, 1023))
         if next(tokens) != "</SPECTRUM>":
-            raise ValueError("Invalid spectrum format")
+            msg = "Invalid spectrum format"
+            raise ValueError(msg)
         values = [int(x) if x != "" else 0 for x in raw]
+    elif "/" in first:
+        values = [int(x) for x in first.removesuffix("/R").split("/")]
     else:
         values = [int(first)]
         values.extend(int(x) for x in islice(tokens, 1023))
     if len(values) != 1024:
-        raise ValueError("Invalid length")
+        msg = f"Invalid spectrum length: {len(values)}"
+        raise ValueError(msg)
     return np.array(values, dtype="i2").reshape((32, 32))
-PARSERS: dict[str, Callable[[Iterator[str]], Any]] = {
+ParserType = Callable[[Iterator[str]], Any]
+PARSERS: dict[str, ParserType] = {
     "I_heating": _parse_float,
     "T_sensor": _parse_int,
     "_T_pcb": _parse_int,
@@ -323,9 +421,19 @@ PARSERS: dict[str, Callable[[Iterator[str]], Any]] = {
     "visibility": _parse_int,
 }
+EMPTY_VALUES: dict[ParserType, Any] = {
+    _parse_int: 0,
+    _parse_float: 0.0,
+    _parse_date: datetime.date(2000, 1, 1),
+    _parse_time: datetime.time(12, 0, 0),
+    _parse_datetime: datetime.datetime(2000, 1, 1),
+    _parse_vector: np.zeros(32, dtype=float),
+    _parse_spectrum: np.zeros((32, 32), dtype="i2"),
+}
 def _parse_headers(line: str) -> list[str]:
-    return [HEADERS[header.strip()] for header in line.split(";")]
+    return [CSV_HEADERS[header.strip()] for header in line.split(";")]
 def _parse_telegram(telegram: Sequence[int | None]) -> list[str]:
@@ -342,43 +450,294 @@ def _read_rows(headers: list[str], rows: list[str]) -> dict[str, list]:
         if row == "":
             continue
         try:
-            tokens = iter(row.removesuffix(";").split(";"))
-            parsed = [PARSERS.get(header, next)(tokens) for header in headers]
-            unread_tokens = list(tokens)
-            if unread_tokens:
-                raise ValueError("More values than expected")
-            for header, value in zip(headers, parsed):
+            parsed = _parse_row(row, headers)
+            for header, value in zip(headers, parsed, strict=True):
                 result[header].append(value)
         except (ValueError, StopIteration):
             invalid_rows += 1
             continue
     if invalid_rows == len(rows):
-        raise DisdrometerDataError("No valid data in file")
+        msg = "No valid data in file"
+        raise DisdrometerDataError(msg)
     if invalid_rows > 0:
-        logging.info(f"Skipped {invalid_rows} invalid rows")
+        logging.info("Skipped %s invalid rows", invalid_rows)
     return result
-def _read_parsivel(
-    filename: Path | str | bytes, telegram: Sequence[int | None] | None = None
-) -> dict[str, np.ndarray]:
-    with open(filename, encoding="latin1", errors="ignore") as file:
-        lines = file.read().splitlines()
-    if not lines:
-        raise DisdrometerDataError("File is empty")
-    if "Date" in lines[0]:
-        headers = _parse_headers(lines[0])
-        data = _read_rows(headers, lines[1:])
-    elif telegram is not None:
-        headers = _parse_telegram(telegram)
-        data = _read_rows(headers, lines)
-    else:
-        raise ValueError("telegram must be specified for files without header")
-    if "_datetime" not in data:
-        data["_datetime"] = [
-            datetime.datetime.combine(date, time)
-            for date, time in zip(data["_date"], data["_time"])
+def _parse_row(row_in: str, headers: list[str]) -> list:
+    tokens = iter(row_in.removesuffix(";").split(";"))
+    parsed = [PARSERS.get(header, next)(tokens) for header in headers]
+    if unread_tokens := list(tokens):
+        msg = f"Unused tokens: {unread_tokens}"
+        raise ValueError(msg)
+    return parsed
+def _read_toa5(filename: str | PathLike) -> dict[str, list]:
+    """Read ASCII data from Campbell Scientific datalogger such as CR1000.
+    References:
+        CR1000 Measurement and Control System.
+        https://s.campbellsci.com/documents/us/manuals/cr1000.pdf
+    """
+    with open(filename, errors="ignore") as file:
+        reader = csv.reader(file)
+        _origin_line = next(reader)
+        header_line = next(reader)
+        headers = [
+            TOA5_HEADERS.get(re.sub(r"\(.*", "", field)) for field in header_line
+        ]
+        if unknown_headers := [
+            header_line[i] for i in range(len(header_line)) if headers[i] is None
+        ]:
+            msg = "Unknown headers: " + ", ".join(unknown_headers)
+            logging.warning(msg)
+        _units_line = next(reader)
+        _process_line = next(reader)
+        data: dict[str, list] = {header: [] for header in headers if header is not None}
+        n_rows = 0
+        n_invalid_rows = 0
+        for data_line in reader:
+            n_rows += 1
+            scalars: dict[str, datetime.datetime | int | float | str] = {}
+            arrays: dict[str, list] = {
+                "number_concentration": [],
+                "fall_velocity": [],
+                "spectrum": [],
+            }
+            try:
+                for header, value in zip(headers, data_line, strict=True):
+                    if header is None:
+                        continue
+                    if header == "_datetime":
+                        scalars[header] = datetime.datetime.strptime(
+                            value,
+                            "%Y-%m-%d %H:%M:%S",
+                        )
+                    elif header in ("number_concentration", "fall_velocity"):
+                        arrays[header].append(float(value))
+                    elif header == "spectrum":
+                        arrays[header].append(int(value))
+                    elif PARSERS.get(header) == _parse_int:
+                        scalars[header] = int(value)
+                    elif PARSERS.get(header) == _parse_float:
+                        scalars[header] = float(value)
+                    else:
+                        scalars[header] = value
+            except ValueError:
+                n_invalid_rows += 1
+                continue
+            for header, scalar in scalars.items():
+                data[header].append(scalar)
+            if "spectrum" in headers:
+                data["spectrum"].append(
+                    np.array(arrays["spectrum"], dtype="i2").reshape((32, 32)),
+                )
+            if "number_concentration" in headers:
+                data["number_concentration"].append(arrays["number_concentration"])
+            if "fall_velocity" in headers:
+                data["fall_velocity"].append(arrays["fall_velocity"])
+        if n_invalid_rows == n_rows:
+            msg = "No valid data in file"
+            raise DisdrometerDataError(msg)
+        if n_invalid_rows > 0:
+            logging.info("Skipped %s invalid rows", n_invalid_rows)
+        return data
+def _read_pyatmoslogger_file(filename: str | PathLike) -> dict[str, list]:
+    """Read CSV file from pyAtmosLogger.
+    References:
+        https://pypi.org/project/pyAtmosLogger/
+    """
+    with open(filename, errors="ignore") as file:
+        lines = file.readlines()
+        header_line = lines[0].strip().strip(";").split(";")
+        headers = [
+            TOA5_HEADERS.get(
+                re.sub(
+                    r"N[0-9][0-9]",
+                    "N",
+                    re.sub(r"v[0-9][0-9]", "V", re.sub(r"M\_.*", "spectrum", field)),
+                ),
+            )
+            for field in header_line
         ]
-    result = {key: np.array(value) for key, value in data.items()}
+        if unknown_headers := [
+            header_line[i] for i in range(len(header_line)) if headers[i] is None
+        ]:
+            msg = "Unknown headers: " + ", ".join(unknown_headers)
+            logging.warning(msg)
+        data: dict[str, list] = {header: [] for header in headers if header is not None}
+        n_rows = 0
+        n_invalid_rows = 0
+        for data_line in lines[1:]:
+            data_line_splat = data_line.strip().strip(";").split(";")
+            n_rows += 1
+            scalars: dict[str, datetime.datetime | int | float | str] = {}
+            arrays: dict[str, list] = {
+                "number_concentration": [],
+                "fall_velocity": [],
+                "spectrum": [],
+            }
+            try:
+                for header, value in zip(headers, data_line_splat, strict=True):
+                    if header is None:
+                        continue
+                    if header == "_datetime":
+                        scalars[header] = datetime.datetime.strptime(
+                            value,
+                            "%Y-%m-%d %H:%M:%S",
+                        )
+                    elif header in ("number_concentration", "fall_velocity"):
+                        arrays[header].append(float(value))
+                    elif header == "spectrum":
+                        arrays[header].append(int(value))
+                    elif PARSERS.get(header) == _parse_int:
+                        scalars[header] = int(value)
+                    elif PARSERS.get(header) == _parse_float:
+                        scalars[header] = float(value)
+                    else:
+                        scalars[header] = value
+            except ValueError:
+                n_invalid_rows += 1
+                continue
+            for header, scalar in scalars.items():
+                data[header].append(scalar)
+            if "spectrum" in headers:
+                data["spectrum"].append(
+                    np.array(arrays["spectrum"], dtype="i2").reshape((32, 32)),
+                )
+            if "number_concentration" in headers:
+                data["number_concentration"].append(arrays["number_concentration"])
+            if "fall_velocity" in headers:
+                data["fall_velocity"].append(arrays["fall_velocity"])
+        if n_invalid_rows == n_rows:
+            msg = "No valid data in file"
+            raise DisdrometerDataError(msg)
+        if n_invalid_rows > 0:
+            logging.info("Skipped %s invalid rows", n_invalid_rows)
+        return data
+def _read_typ_op4a(lines: list[str]) -> dict[str, Any]:
+    """Read output of "CS/PA" command. The output starts with line "TYP OP4A"
+    followed by one line per measured variable in format: <number>:<value>.
+    Output ends with characters: <ETX><CR><LF><NUL>. Lines are separated by
+    <CR><LF>.
+    """
+    data = {}
+    for line in lines:
+        if ":" not in line:
+            continue
+        key, value = line.strip().split(":", maxsplit=1)
+        # Skip datetime and 16-bit values.
+        if key in ("19", "30", "31", "32", "33"):
+            continue
+        varname = TELEGRAM.get(int(key))
+        if varname is None:
+            continue
+        parser = PARSERS.get(varname, next)
+        tokens = value.split(";")
+        data[varname] = parser(iter(tokens))
+    return data
+def _read_fmi(content: str) -> dict[str, list]:
+    r"""Read format used by Finnish Meteorological Institute and University of
+    Helsinki.
+    Format consists of sequence of the following:
+    - "[YYYY-MM-DD HH:MM:SS\n"
+    - output of "CS/PA" command without non-printable characters at the end
+    - "]\n"
+    """
+    output: dict[str, list] = {"_datetime": []}
+    for m in re.finditer(
+        r"\[(?P<year>\d+)-(?P<month>\d+)-(?P<day>\d+) "
+        r"(?P<hour>\d+):(?P<minute>\d+):(?P<second>\d+)"
+        r"(?P<output>[^\]]*)\]",
+        content,
+    ):
+        try:
+            record = _read_typ_op4a(m["output"].splitlines())
+        except ValueError:
+            continue
+        for key, value in record.items():
+            if key not in output:
+                output[key] = [None] * len(output["_datetime"])
+            output[key].append(value)
+        for key in output:
+            if key not in record and key != "_datetime":
+                output[key].append(None)
+        output["_datetime"].append(
+            datetime.datetime(
+                int(m["year"]),
+                int(m["month"]),
+                int(m["day"]),
+                int(m["hour"]),
+                int(m["minute"]),
+                int(m["second"]),
+            )
+        )
+    return output
+def _read_parsivel(
+    filenames: Iterable[str | PathLike],
+    telegram: Sequence[int | None] | None = None,
+    timestamps: Sequence[datetime.datetime] | None = None,
+) -> dict[str, npt.NDArray]:
+    combined_data = defaultdict(list)
+    for filename in filenames:
+        with open(filename, encoding="latin1", errors="ignore") as file:
+            content = file.read()
+            lines = content.splitlines()
+        if not lines:
+            msg = f"File '{filename}' is empty"
+            raise DisdrometerDataError(msg)
+        if "TOA5" in lines[0]:
+            data = _read_toa5(filename)
+        elif "N00" in lines[0]:
+            data = _read_pyatmoslogger_file(filename)
+        elif "TYP OP4A" in lines[0]:
+            data = _read_typ_op4a(lines)
+            data = {key: [value] for key, value in data.items()}
+        elif "Date" in lines[0]:
+            headers = _parse_headers(lines[0])
+            data = _read_rows(headers, lines[1:])
+        elif "[" in lines[0]:
+            data = _read_fmi(content)
+        elif telegram is not None:
+            headers = _parse_telegram(telegram)
+            data = _read_rows(headers, lines)
+        else:
+            msg = "telegram must be specified for files without header"
+            raise ValueError(msg)
+        if "_datetime" not in data and timestamps is None:
+            data["_datetime"] = [
+                datetime.datetime.combine(date, time)
+                for date, time in zip(data["_date"], data["_time"], strict=True)
+            ]
+        for key, values in data.items():
+            combined_data[key].extend(values)
+    if timestamps is not None:
+        combined_data["_datetime"] = list(timestamps)
+    result: dict = {}
+    for key, value in combined_data.items():
+        array = np.array(
+            [
+                x
+                if x is not None
+                else (EMPTY_VALUES[PARSERS[key]] if key in PARSERS else "")
+                for x in value
+            ]
+        )
+        mask = [np.full(array.shape[1:], x is None) for x in value]
+        result[key] = ma.array(array, mask=mask)
     result["time"] = result["_datetime"].astype("datetime64[s]")
     return result

cloudnetpy 1.49.9__py3-none-any.whl → 1.87.3__py3-none-any.whl

cloudnetpy 1.49.9py3-none-any.whl → 1.87.3py3-none-any.whl