PyPI - seabirdfilehandler - Versions diffs - 0.7.6__tar.gz → 0.8.0__tar.gz - Mend

seabirdfilehandler 0.7.6tar.gz → 0.8.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of seabirdfilehandler might be problematic. Click here for more details.

Files changed (16) hide show

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: seabirdfilehandler
-Version: 0.7.6
+Version: 0.8.0
 Summary: Library of parsers to interact with SeaBird CTD files.
 License-File: LICENSE
 Keywords: CTD,parser,seabird,data
@@ -15,7 +15,19 @@ Classifier: Topic :: Scientific/Engineering :: Oceanography
 Classifier: Programming Language :: Python :: 3 :: Only
 Classifier: Programming Language :: Python :: 3.12
 Classifier: Programming Language :: Python :: 3.13
+Classifier: Programming Language :: Python :: 3.14
+Provides-Extra: docs
+Provides-Extra: test
+Requires-Dist: myst-parser (>=4.0.1) ; extra == "docs"
 Requires-Dist: pandas (>=2.2.1)
+Requires-Dist: parameterized (>=0.9.0) ; extra == "test"
+Requires-Dist: pre-commit (>=3.6.2) ; extra == "docs"
+Requires-Dist: pre-commit (>=3.6.2) ; extra == "test"
+Requires-Dist: pyment (>=0.3.3) ; extra == "docs"
+Requires-Dist: pytest (>=8.3.0) ; extra == "test"
+Requires-Dist: sphinx (>=8.2.3) ; extra == "docs"
+Requires-Dist: sphinx-autodoc-typehints (>=1.24.1) ; extra == "docs"
+Requires-Dist: sphinx-rtd-theme (>=1.3.0) ; extra == "docs"
 Requires-Dist: xmltodict (>=0.13.0)
 Project-URL: Documentation, https://ctd-software.pages.io-warnemuende.de/seabirdfilehandler
 Project-URL: Homepage, https://ctd-software.pages.io-warnemuende.de/seabirdfilehandler

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/pyproject.toml RENAMED Viewed

@@ -15,49 +15,35 @@ classifiers = [
     "Programming Language :: Python :: 3 :: Only",
     "Programming Language :: Python :: 3.12",
     "Programming Language :: Python :: 3.13",
+    "Programming Language :: Python :: 3.14",
 ]
 urls.homepage = "https://ctd-software.pages.io-warnemuende.de/seabirdfilehandler"
 urls.repository = "https://git.io-warnemuende.de/CTD-Software/SeabirdFileHandler"
 urls.documentation = "https://ctd-software.pages.io-warnemuende.de/seabirdfilehandler"
 dynamic = []
-version = "0.7.6"
+requires-python = ">=3.12"
+dependencies = ["pandas>=2.2.1", "xmltodict>=0.13.0"]
+version = "0.8.0"
+[project.optional-dependencies]
+test = ["pytest>=8.3.0", "parameterized>=0.9.0", "pre-commit>=3.6.2"]
+docs = [
+    "pre-commit>=3.6.2",
+    "sphinx>=8.2.3",
+    "sphinx-rtd-theme>=1.3.0",
+    "sphinx-autodoc-typehints>=1.24.1",
+    "myst-parser>=4.0.1",
+    "pyment>=0.3.3",
+]
 [tool.poetry]
 [tool.poetry.requires-plugins]
 poetry-dynamic-versioning = { version = ">=1.0.0,<2.0.0", extras = ["plugin"] }
-[tool.poetry.dependencies]
-python = ">=3.12"
-pandas = ">=2.2.1"
-xmltodict = ">=0.13.0"
-[tool.poetry.group.dev.dependencies]
-pytest = ">=8.3.0"
-pytest-xdist = ">=3.6.1"
-pytest-cov = ">=6.0.0"
-parameterized = ">=0.9.0"
-sphinx = ">=8.2.3"
-sphinx-rtd-theme = ">=1.3.0"
-sphinx-autodoc-typehints = ">=1.24.1"
-pyment = ">=0.3.3"
-pylint = ">=3.0.2"
-pre-commit = ">=3.6.2"
-tomlkit = ">=0.13.2"
-myst-parser = "^4.0.1"
 [tool.pytest.ini_options]
 pythonpath = [".", "src", "src/seabirdfilehandler"]
-filterwarnings = [
-    "error",
-    "ignore::UserWarning",
-    'ignore::DeprecationWarning',
-    # note the use of single quote below to denote "raw" strings in TOML
-    'ignore: datetime.datetime.utcfromtimestamp\(\) is deprecated:DeprecationWarning',
-]
-[tool.coverage.run]
-omit = ["tests/*"]
+filterwarnings = ["error", "ignore::FutureWarning"]
 [tool.ruff]
 line-length = 79
@@ -65,7 +51,6 @@ line-length = 79
 [tool.ruff.lint]
 ignore = ["F403", "F821"]
 [tool.poetry-dynamic-versioning]
 enable = false

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/bottlefile.py RENAMED Viewed

@@ -1,9 +1,11 @@
+import logging
+from datetime import datetime, time
 from pathlib import Path
 from typing import Union
-from datetime import datetime, time
-import pandas as pd
 import numpy as np
-import logging
+import pandas as pd
 from seabirdfilehandler import DataFile
 logger = logging.getLogger(__name__)

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/bottlelogfile.py RENAMED Viewed

@@ -1,7 +1,9 @@
-from datetime import datetime
-import re
 import logging
+import re
+from datetime import datetime
 import pandas as pd
 from seabirdfilehandler import DataFile
 logger = logging.getLogger(__name__)

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/cnvfile.py RENAMED Viewed

@@ -1,9 +1,11 @@
-from pathlib import Path
+import logging
 from datetime import datetime, timedelta
-import pandas as pd
+from pathlib import Path
 import numpy as np
-import logging
-from seabirdfilehandler import DataFile, Parameters, CnvProcessingSteps
+import pandas as pd
+from seabirdfilehandler import CnvProcessingSteps, DataFile, Parameters
 logger = logging.getLogger(__name__)

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/datafiles.py RENAMED Viewed

@@ -1,8 +1,9 @@
+import logging
 from pathlib import Path
-import xmltodict
-import pandas as pd
 import numpy as np
-import logging
+import pandas as pd
+import xmltodict
 logger = logging.getLogger(__name__)

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/file_collection.py RENAMED Viewed

@@ -1,15 +1,18 @@
 from __future__ import annotations
-from pathlib import Path
 import logging
+import warnings
 from collections import UserList
+from pathlib import Path
 from typing import Callable, Type
-import warnings
-import pandas as pd
 import numpy as np
+import pandas as pd
 from seabirdfilehandler import (
-    CnvFile,
     BottleFile,
     BottleLogFile,
+    CnvFile,
     DataFile,
     HexFile,
 )
@@ -307,10 +310,8 @@ class FileCollection(UserList):
         for parameter in df.columns:
             if parameter in ["datetime"]:
                 continue
-            try:
-                df[parameter] = df[parameter].astype("float")
-            finally:
-                continue
+            df[parameter] = df[parameter].astype("float")
+            continue
         return df
     def select_real_scan_data(self, df: pd.DataFrame) -> pd.DataFrame:
@@ -416,13 +417,25 @@ class CnvCollection(FileCollection):
         A list of dictionaries that represent the data column information.
         """
         all_column_descriptions = [
-            file.parameters.metadata for file in self.data
+            file.parameters.get_metadata() for file in self.data
         ]
-        for info in all_column_descriptions:
+        for index, info in enumerate(all_column_descriptions):
             if all_column_descriptions[0] != info:
-                raise AssertionError(
-                    "Acting on differently formed data files, aborting"
-                )
+                for expected, real in zip(
+                    all_column_descriptions[0].items(), info.items()
+                ):
+                    # allow difference in latitude inside depth
+                    if expected[0] == "depSM":
+                        if real[0] != "depSM":
+                            raise AssertionError(
+                                f"Data files {self.data[0].path_to_file} and {self.data[index].path_to_file} differ in:\n{expected} and {real}"
+                            )
+                    elif expected != real:
+                        raise AssertionError(
+                            f"Data files {self.data[0].path_to_file} and {self.data[index].path_to_file} differ in:\n{expected} and {real}"
+                        )
         return all_column_descriptions[0]
     def get_array(self) -> np.ndarray:
@@ -434,7 +447,7 @@ class CnvCollection(FileCollection):
         A numpy array, representing the data of all input files.
         """
         return np.concatenate(
-            [file.parameters.create_full_ndarray() for file in self.data]
+            [file.parameters.get_full_data_array() for file in self.data]
         )
     def get_processing_steps(self) -> list:

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/geomar_ctd_file_parser.py RENAMED Viewed

@@ -1,4 +1,5 @@
 from pathlib import Path
 import pandas as pd

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/hexfile.py RENAMED Viewed

@@ -1,4 +1,5 @@
 from pathlib import Path
 from seabirdfilehandler import DataFile, XMLCONFile

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/parameter.py RENAMED Viewed

@@ -1,10 +1,12 @@
 from __future__ import annotations
-from typing import Tuple
+import logging
 import re
 from collections import UserDict
+from typing import Tuple
 import numpy as np
 import pandas as pd
-import logging
 logger = logging.getLogger(__name__)
@@ -34,18 +36,30 @@ class Parameters(UserDict):
         metadata: list,
         only_header: bool = False,
     ):
-        self.raw_input_data = data
-        self.raw_metadata = metadata
-        self.differentiate_table_description()
-        self.metadata, self.duplicate_columns = self.reading_data_header(
+        self.data = {}
+        self.differentiate_table_description(metadata)
+        parsed_metadata, self.duplicate_columns = self.reading_data_header(
             metadata
         )
         if not only_header:
-            self.full_data_array = self.create_full_ndarray()
-            self.data = self.create_parameter_instances()
+            self.full_data_array = self.create_full_ndarray(data)
+            self.create_parameter_instances(
+                self.full_data_array, parsed_metadata
+            )
+    def get_full_data_array(self) -> np.ndarray:
+        return np.array(
+            [parameter.data for parameter in self.data.values()], dtype=float
+        ).T
-    def get_parameter_names(self) -> list[str]:
-        return [parameter["name"] for parameter in self.metadata.values()]
+    def get_names(self) -> list[str]:
+        return [parameter.name for parameter in self.data.values()]
+    def get_metadata(self) -> dict[str, dict]:
+        return {
+            parameter.name: parameter.metadata
+            for parameter in self.data.values()
+        }
     def get_parameter_list(self) -> list[Parameter]:
         """ """
@@ -66,9 +80,6 @@ class Parameters(UserDict):
         A numpy array of the same shape as the cnv files data table
         """
-        data_table = (
-            self.raw_input_data if len(data_table) == 0 else data_table
-        )
         n = 11
         row_list = []
         for line in data_table:
@@ -82,7 +93,8 @@ class Parameters(UserDict):
     def create_parameter_instances(
         self,
-        metadata: dict[str, dict] = {},
+        array_data: np.ndarray,
+        metadata: dict[str, dict],
     ) -> dict[str, Parameter]:
         """
         Differentiates the individual parameter columns into separate parameter
@@ -99,30 +111,24 @@ class Parameters(UserDict):
         A dictionary of parameter instances
         """
-        metadata = (
-            self.metadata if len(list(metadata.keys())) == 0 else metadata
-        )
         parameter_dict = {}
         list_of_metadata_shortnames = list(metadata.keys())
         # if column number and metadata number is different, we are propably
         # working with duplicate_columns and will drop the duplicates
-        if self.full_data_array.shape[1] != len(list_of_metadata_shortnames):
-            self.full_data_array = np.delete(
-                self.full_data_array, self.duplicate_columns, 1
-            )
-            assert self.full_data_array.shape[1] == len(
-                list_of_metadata_shortnames
-            )
+        if array_data.shape[1] != len(list_of_metadata_shortnames):
+            array_data = np.delete(array_data, self.duplicate_columns, 1)
+            assert array_data.shape[1] == len(list_of_metadata_shortnames)
             # rewrite the column number in the metadata header
             self.data_table_stats["nquan"] = str(
                 int(self.data_table_stats["nquan"])
                 - len(self.duplicate_columns)
             )
-        for i in range(self.full_data_array.shape[1]):
-            column_data = self.full_data_array[:, i]
+        for i in range(array_data.shape[1]):
             key = list_of_metadata_shortnames[i]
-            parameter_dict[key] = Parameter(
-                data=column_data, metadata=metadata[key]
+            parameter_dict[key] = self.create_parameter(
+                data=array_data[:, i],
+                metadata=metadata[key],
+                name=key,
             )
         return parameter_dict
@@ -130,17 +136,25 @@ class Parameters(UserDict):
         """Recreates the data table descriptions, like column names and spans
         from the structured dictionaries these values were stored in."""
         new_table_info = []
-        for key, value in self.data_table_stats.items():
-            new_table_info.append(f"{key} = {value}\n")
-        for index, (name, _) in enumerate(self.data_table_names_and_spans):
-            new_table_info.append(f"name {index} = {name}\n")
-        for index, (_, span) in enumerate(self.data_table_names_and_spans):
-            new_table_info.append(f"span {index} = {span}\n")
+        # 'data table stats'
+        data_array = self.get_full_data_array()
+        new_table_info.append(f"nquan = {data_array.shape[1]}")
+        new_table_info.append(f"nvalues = {data_array.shape[0]}")
+        new_table_info.append(f"units = {self.data_table_stats['units']}\n")
+        # 'data tables names'
+        for index, metadata in enumerate(self.get_metadata().values()):
+            new_table_info.append(
+                f"name {index} = {metadata['shortname']}: {metadata['longinfo']}\n"
+            )
+        # 'data table spans'
+        for index, (minimum, maximum) in enumerate(self.get_spans()):
+            new_table_info.append(f"span {index} = {minimum}, {maximum}\n")
+        # 'data table misc'
         for key, value in self.data_table_misc.items():
             new_table_info.append(f"{key} = {value}\n")
         return new_table_info
-    def differentiate_table_description(self):
+    def differentiate_table_description(self, metadata: list):
         """
         The original method that structures data table metadata.
@@ -151,12 +165,12 @@ class Parameters(UserDict):
         column_names = []
         column_value_spans = []
         post = []
-        for line in self.raw_metadata:
+        for line in metadata:
             if line.startswith("name"):
-                column_names.append(line.split("=")[1].strip())
+                column_names.append(line.split("=", 1)[1].strip())
             elif line.startswith("span"):
                 past_spans = True
-                column_value_spans.append(line.split("=")[1].strip())
+                column_value_spans.append(line.split("=", 1)[1].strip())
             else:
                 if not past_spans:
                     pre.append(line)
@@ -164,7 +178,7 @@ class Parameters(UserDict):
                     post.append(line)
         assert len(column_names) == len(column_value_spans)
         self.data_table_stats = {
-            line.split("=")[0].strip(): line.split("=")[1].strip()
+            line.split("=")[0].strip(): line.split("=", 1)[1].strip()
             for line in pre
         }
         self.data_table_names_and_spans = [
@@ -172,7 +186,7 @@ class Parameters(UserDict):
             for name, span in zip(column_names, column_value_spans)
         ]
         self.data_table_misc = {
-            line.split("=")[0].strip(): line.split("=")[1].strip()
+            line.split("=")[0].strip(): line.split("=", 1)[1].strip()
             for line in post
         }
@@ -186,31 +200,18 @@ class Parameters(UserDict):
             The new parameter
         """
-        position_index = -1
-        # add to parameter dict at given
+        # add to parameter dict at given position
         if position:
             new_dict = {}
-            for index, (key, value) in enumerate(self.data.items()):
+            for key, value in self.data.items():
                 new_dict[key] = value
                 if key == position:
                     new_dict[parameter.name] = parameter
-                    position_index = index + 1
             self.data = new_dict
         else:
             self.data[parameter.name] = parameter
-        # update metadata dict
-        self.metadata = {
-            parameter.name: parameter.metadata
-            for parameter in self.data.values()
-        }
-        # add to the data array if data
-        if parameter.type == "data":
-            self.full_data_array = np.insert(
-                self.full_data_array, position_index, parameter.data, axis=1
-            )
     def create_parameter(
         self,
         data: np.ndarray | int | float | str | None,
@@ -355,17 +356,17 @@ class Parameters(UserDict):
         """
-        if len(header_info) == 0:
-            header_info = self.raw_metadata
         table_header = {}
         duplicate_columns = []
         for line in header_info:
             if line.startswith("name"):
                 header_meta_info = {}
                 # get basic shortname and the full, non-differentiated info
-                shortname = longinfo = line_info = line.split("=")[1].strip()
+                shortname = longinfo = line_info = line.split("=", 1)[
+                    1
+                ].strip()
                 try:
-                    shortname, longinfo = line_info.split(":")
+                    shortname, longinfo = line_info.split(":", 1)
                 except IndexError:
                     pass
                 finally:
@@ -373,7 +374,7 @@ class Parameters(UserDict):
                     if shortname in list(table_header.keys()):
                         try:
                             duplicate_columns.append(
-                                int(line.split("=")[0].strip().split()[1])
+                                int(line.split("=", 1)[0].strip().split()[1])
                             )
                         except IndexError as error:
                             logger.error(
@@ -450,6 +451,9 @@ class Parameter:
         self.data = data
         self.metadata = metadata
         self.name = metadata["shortname"]
+        self.param = re.split(r"[,\s]", metadata["name"])[0]
+        self.sensor_number = 2 if metadata["name"][-1] == "2" else 1
+        self.unit = metadata["unit"]
         self.type = "data" if self.data.dtype in ["float", "int"] else "meta"
         self.parse_to_float()
         self.update_span()

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/processing_steps.py RENAMED Viewed

@@ -1,6 +1,7 @@
 from __future__ import annotations
-from collections import UserList
 import copy
+from collections import UserList
 class CnvProcessingSteps(UserList):
@@ -149,8 +150,7 @@ class CnvProcessingSteps(UserList):
             pass
         else:
             dictionary[key.strip()] = value.strip()
-        finally:
-            return dictionary
+        return dictionary
     def get_step(self, step: str) -> ProcessingStep | None:
         """

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/xmlfiles.py RENAMED Viewed

@@ -1,7 +1,8 @@
-from pathlib import Path
-from collections import UserDict
-import xml.etree.ElementTree as ET
 import json
+import xml.etree.ElementTree as ET
+from collections import UserDict
+from pathlib import Path
 import xmltodict
 from seabirdfilehandler.utils import UnexpectedFileFormat

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/LICENSE RENAMED Viewed

File without changes

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/README.md RENAMED Viewed

File without changes

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/__init__.py RENAMED Viewed

File without changes

{seabirdfilehandler-0.7.6 → seabirdfilehandler-0.8.0}/src/seabirdfilehandler/utils.py RENAMED Viewed

File without changes

seabirdfilehandler 0.7.6__tar.gz → 0.8.0__tar.gz

Potentially problematic release.

seabirdfilehandler 0.7.6tar.gz → 0.8.0tar.gz