PyPI - hydroserverpy - Versions diffs - 0.5.0b3__py3-none-any.whl → 0.5.0b5__py3-none-any.whl - Mend

hydroserverpy 0.5.0b3py3-none-any.whl → 0.5.0b5py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of hydroserverpy might be problematic. Click here for more details.

Files changed (9) hide show

hydroserverpy/api/models/etl/data_source.py CHANGED Viewed

@@ -1,8 +1,8 @@
+import requests
 import tempfile
 from typing import Union, List, Optional, TYPE_CHECKING
 from uuid import UUID
 from pydantic import BaseModel, Field
-from urllib.request import urlopen
 from hydroserverpy.etl_csv.hydroserver_etl_csv import HydroServerETLCSV
 from .orchestration_system import OrchestrationSystem
 from .orchestration_configuration import OrchestrationConfigurationFields
@@ -135,14 +135,17 @@ class DataSource(HydroServerModel, DataSourceFields, OrchestrationConfigurationF
                 )
                 loader.run()
         elif self.settings["extractor"]["type"] == "HTTP":
-            with tempfile.NamedTemporaryFile(mode="w") as temp_file:
-                with urlopen(self.settings["extractor"]["urlTemplate"]) as response:
-                    chunk_size = 1024 * 1024 * 10  # Use a 10mb chunk size.
-                    while True:
-                        chunk = response.read(chunk_size)
-                        if not chunk:
-                            break
-                        temp_file.write(chunk)
+            with tempfile.NamedTemporaryFile(mode="w+") as temp_file:
+                response = requests.get(
+                    self.settings["extractor"]["urlTemplate"],
+                    stream=True,
+                    timeout=60,
+                )
+                response.raise_for_status()
+                chunk_size = 1024 * 1024 * 10  # Use a 10mb chunk size.
+                for chunk in response.iter_content(chunk_size=chunk_size):
+                    if chunk:
+                        temp_file.write(chunk.decode("utf-8"))
                 temp_file.seek(0)
                 loader = HydroServerETLCSV(
                     self._connection, data_file=temp_file, data_source=self

hydroserverpy/api/models/sta/datastream.py CHANGED Viewed

@@ -141,20 +141,6 @@ class Datastream(HydroServerModel, DatastreamFields):
             _connection=_connection, _model_ref="datastreams", _uid=_uid, **data
         )
-        self._workspace_id = str(
-            data.get("workspace_id")
-            or data.get("workspaceId")
-            or data["properties"]["workspace"]["id"]
-        )
-        self._processing_level_id = str(
-            data.get("workspace_id")
-            or data.get("workspaceId")
-            or data["properties"]["processingLevelId"]
-        )
-        self._unit_id = str(
-            data.get("unit_id") or data.get("unitId") or data["properties"]["unitId"]
-        )
         self._workspace = None
         self._thing = None
         self._observed_property = None
@@ -167,7 +153,8 @@ class Datastream(HydroServerModel, DatastreamFields):
         """The workspace this datastream belongs to."""
         if self._workspace is None:
-            self._workspace = self._connection.workspaces.get(uid=self._workspace_id)
+            datastream = self._connection.request("get", f"/api/data/datastreams/{str(self.uid)}").json()
+            self._workspace = self._connection.workspaces.get(uid=datastream["workspaceId"])
         return self._workspace
@@ -246,7 +233,8 @@ class Datastream(HydroServerModel, DatastreamFields):
         """The unit this datastream uses."""
         if self._unit is None:
-            self._unit = self._connection.units.get(uid=self._unit_id)
+            datastream = self._connection.request("get", f"/api/data/datastreams/{str(self.uid)}").json()
+            self._unit = self._connection.units.get(uid=datastream["unitId"])
             self._original_data["unit"] = self._unit
         return self._unit
@@ -263,9 +251,8 @@ class Datastream(HydroServerModel, DatastreamFields):
         """The processing level of this datastream."""
         if self._processing_level is None:
-            self._processing_level = self._connection.processinglevels.get(
-                uid=self._processing_level_id
-            )
+            datastream = self._connection.request("get", f"/api/data/datastreams/{str(self.uid)}").json()
+            self._processing_level = self._connection.processinglevels.get(uid=datastream["processingLevelId"])
             self._original_data["processing_level"] = self._processing_level
         return self._processing_level
@@ -285,13 +272,10 @@ class Datastream(HydroServerModel, DatastreamFields):
         """Refresh this datastream from HydroServer."""
         self._workspace = None
-        self._workspace_id = None
         self._thing = None
         self._observed_property = None
         self._unit = None
-        self._unit_id = None
         self._processing_level = None
-        self._processing_level_id = None
         self._sensor = None
         super()._refresh()
@@ -336,3 +320,23 @@ class Datastream(HydroServerModel, DatastreamFields):
             uid=self.uid,
             observations=observations,
         )
+    # TODO: Find a better long-term solution for this issue.
+    def sync_phenomenon_end_time(self):
+        """Ensures the phenomenon_end_time field matches the actual end time of the observations."""
+        response = self._connection.request(
+            "get", f"/api/data/datastreams/{str(self.uid)}/observations",
+            params={
+                "order": "desc",
+                "page": 1,
+                "page_size": 1
+            }
+        ).json()
+        if len(response["phenomenon_time"]) > 0:
+            self.phenomenon_end_time = datetime.fromisoformat(response["phenomenon_time"][0])
+        else:
+            self.phenomenon_end_time = None
+        self.save()

hydroserverpy/etl_csv/hydroserver_etl_csv.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import csv
+import math
 import logging
 import croniter
 import pandas as pd
@@ -51,7 +52,7 @@ class HydroServerETLCSV:
         self._file_header_error = False
         self._file_timestamp_error = False
-        self._chunk_size = 10000
+        self._chunk_size = 1000
         self._observations = {}
     def run(self):
@@ -124,6 +125,9 @@ class HydroServerETLCSV:
         timestamp = self._parse_row_timestamp(row)
         for datastream in self._datastreams.values():
+            if index == self._data_source.settings["transformer"]["dataStartRow"]:
+                datastream.sync_phenomenon_end_time()
             if str(datastream.uid) not in self._datastream_start_row_indexes.keys():
                 if (
                     not datastream.phenomenon_end_time
@@ -138,14 +142,27 @@ class HydroServerETLCSV:
                 if str(datastream.uid) not in self._observations.keys():
                     self._observations[str(datastream.uid)] = []
+                raw_result = row[
+                    self._datastream_column_indexes[
+                        self._datastream_mapping[str(datastream.uid)]
+                    ]
+                ]
+                if isinstance(raw_result, (int, float)):
+                    result = raw_result
+                else:
+                    try:
+                        result = float(raw_result)
+                    except (TypeError, ValueError):
+                        result = datastream.no_data_value
+                if math.isnan(result):
+                    result = datastream.no_data_value
                 self._observations[str(datastream.uid)].append(
                     {
                         "phenomenon_time": timestamp,
-                        "result": row[
-                            self._datastream_column_indexes[
-                                self._datastream_mapping[str(datastream.uid)]
-                            ]
-                        ],
+                        "result": result,
                     }
                 )
@@ -282,8 +299,9 @@ class HydroServerETLCSV:
                         uid=datastream_id,
                         observations=observations_df,
                     )
-                except HTTPError:
+                except HTTPError as e:
                     failed_datastreams.append(datastream_id)
+                    logger.error(f"Failed to POST observations to datastream: {str(datastream_id)} - {e}")
             elif datastream_id in self._failed_datastreams:
                 logger.info(
@@ -308,13 +326,13 @@ class HydroServerETLCSV:
         if self._data_source.crontab is not None:
             next_run = croniter.croniter(
-                self._data_source.crontab, datetime.now()
+                self._data_source.crontab, datetime.now(timezone.utc)
             ).get_next(datetime)
         elif (
             self._data_source.interval is not None
             and self._data_source.interval_units is not None
         ):
-            next_run = datetime.now() + timedelta(
+            next_run = datetime.now(timezone.utc) + timedelta(
                 **{self._data_source.interval_units: self._data_source.interval}
             )
         else:

{hydroserverpy-0.5.0b3.dist-info → hydroserverpy-0.5.0b5.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: hydroserverpy
-Version: 0.5.0b3
+Version: 0.5.0b5
 Requires-Python: <4,>=3.9
 License-File: LICENSE
 Requires-Dist: requests>=2

{hydroserverpy-0.5.0b3.dist-info → hydroserverpy-0.5.0b5.dist-info}/RECORD RENAMED Viewed

@@ -6,7 +6,7 @@ hydroserverpy/api/models/__init__.py,sha256=ELrf3b7Aix7YcVF__Q_8e_G_FF8GYlX0J5l7
 hydroserverpy/api/models/base.py,sha256=dc2tfMSgizymxAAOVURfy7Jzeh6xIiiq7hfWZI7l1_Q,2280
 hydroserverpy/api/models/etl/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 hydroserverpy/api/models/etl/data_archive.py,sha256=u-gpvUsaWaw0kyF3bPMm2e55Jx2yhvSV9ufXXaNtrTc,3429
-hydroserverpy/api/models/etl/data_source.py,sha256=ca-9KKVhkLNaUn3vOIk-JgdWk58fTRme8YKIesk8WIw,5455
+hydroserverpy/api/models/etl/data_source.py,sha256=x88Z-CAzDljQEbGlif1KmQ4zNjQBiJrKNqirpoCZnPs,5538
 hydroserverpy/api/models/etl/orchestration_configuration.py,sha256=ElSrgi7ioFZJFJg6aGogW5ZZk7fA17y4p--yWwiOhZ0,1367
 hydroserverpy/api/models/etl/orchestration_system.py,sha256=25En2G0z1gQzN-RW3UlrEGgkC952QDW21oYnawCX8hY,2357
 hydroserverpy/api/models/iam/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
@@ -15,7 +15,7 @@ hydroserverpy/api/models/iam/collaborator.py,sha256=jp661DKDCwk8c8HFPAV-YVhEc80F
 hydroserverpy/api/models/iam/role.py,sha256=8FVTj_1QwtPF9tk7baliMVg000kjc5N8oP6eYo8vTDY,275
 hydroserverpy/api/models/iam/workspace.py,sha256=s9u1oZyOdxM7txjJARFcIBrWMHQSDxODdreiatFsXJs,7331
 hydroserverpy/api/models/sta/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-hydroserverpy/api/models/sta/datastream.py,sha256=sB-KifvegbyDUnyPE_NCHFrab1ZSVVb6g-Gs7kUgMiE,10774
+hydroserverpy/api/models/sta/datastream.py,sha256=vRjgwAKaoBJEtgUXrZjIS-VuIZsCilm7FRwbvLS8Y8o,11186
 hydroserverpy/api/models/sta/observed_property.py,sha256=ThTg8aPMHPxbk9Hzpxw3AwM16gE1xvYpRK8UkiOdGeA,2180
 hydroserverpy/api/models/sta/processing_level.py,sha256=y5_0wX7QGXgswvukXJtbpOiTCZ9pI8E08DXaTSUHakg,1470
 hydroserverpy/api/models/sta/result_qualifier.py,sha256=IJcY04KjP9e2D-jPzUJjH2PC-JvDNCjbi5LKkTVSwgw,1416
@@ -55,12 +55,12 @@ hydroserverpy/etl/transformers/csv_transformer.py,sha256=9DKSO4NfUUDlr_c6UnH4AU3
 hydroserverpy/etl/transformers/json_transformer.py,sha256=ity0MXcYjEnlun4Y6cVSrnjrglKrK4JOXXHxWHIHN2A,2323
 hydroserverpy/etl_csv/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 hydroserverpy/etl_csv/exceptions.py,sha256=0UY8YUlNepG0y6FfH36hJyR1bOhwYHSZIdUSSMTg7GA,314
-hydroserverpy/etl_csv/hydroserver_etl_csv.py,sha256=y7AI6MjrcM9Dh-Id7G77dLzogZ7CSO4JhFR-AirMnJA,13854
+hydroserverpy/etl_csv/hydroserver_etl_csv.py,sha256=0ueBphEaAAlsb0cn71Ihgd5zOD8Zdu4Ts_yGwvXW53M,14544
 hydroserverpy/quality/__init__.py,sha256=GGBMkFSXciJLYrbV-NraFrj_mXWCy_GTcy9KKrKXU4c,84
 hydroserverpy/quality/service.py,sha256=U02UfLKVmFvr5ySiH0n0JYzUIabq5uprrHIiwcqBlqY,13879
-hydroserverpy-0.5.0b3.dist-info/licenses/LICENSE,sha256=xVqFxDw3QOEJukakL7gQCqIMTQ1dlSCTo6Oc1otNW80,1508
-hydroserverpy-0.5.0b3.dist-info/METADATA,sha256=O1XE90QxIZLWaNymaUyCubt3NyuqJ--m-b7vuzHQ9H8,532
-hydroserverpy-0.5.0b3.dist-info/WHEEL,sha256=lTU6B6eIfYoiQJTZNc-fyaR6BpL6ehTzU3xGYxn2n8k,91
-hydroserverpy-0.5.0b3.dist-info/top_level.txt,sha256=Zf37hrncXLOYvXhgCrf5mZdeq81G9fShdE2LfYbtb7w,14
-hydroserverpy-0.5.0b3.dist-info/zip-safe,sha256=AbpHGcgLb-kRsJGnwFEktk7uzpZOCcBY74-YBdrKVGs,1
-hydroserverpy-0.5.0b3.dist-info/RECORD,,
+hydroserverpy-0.5.0b5.dist-info/licenses/LICENSE,sha256=xVqFxDw3QOEJukakL7gQCqIMTQ1dlSCTo6Oc1otNW80,1508
+hydroserverpy-0.5.0b5.dist-info/METADATA,sha256=2MHOiPK4LfT1plINuLzDUiT0TwVmD2yqZu3edn0BYCI,532
+hydroserverpy-0.5.0b5.dist-info/WHEEL,sha256=SmOxYU7pzNKBqASvQJ7DjX3XGUF92lrGhMb3R6_iiqI,91
+hydroserverpy-0.5.0b5.dist-info/top_level.txt,sha256=Zf37hrncXLOYvXhgCrf5mZdeq81G9fShdE2LfYbtb7w,14
+hydroserverpy-0.5.0b5.dist-info/zip-safe,sha256=AbpHGcgLb-kRsJGnwFEktk7uzpZOCcBY74-YBdrKVGs,1
+hydroserverpy-0.5.0b5.dist-info/RECORD,,

{hydroserverpy-0.5.0b3.dist-info → hydroserverpy-0.5.0b5.dist-info}/WHEEL RENAMED Viewed

@@ -1,5 +1,5 @@
 Wheel-Version: 1.0
-Generator: setuptools (78.1.1)
+Generator: setuptools (79.0.1)
 Root-Is-Purelib: true
 Tag: py3-none-any

{hydroserverpy-0.5.0b3.dist-info → hydroserverpy-0.5.0b5.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{hydroserverpy-0.5.0b3.dist-info → hydroserverpy-0.5.0b5.dist-info}/top_level.txt RENAMED Viewed

File without changes

{hydroserverpy-0.5.0b3.dist-info → hydroserverpy-0.5.0b5.dist-info}/zip-safe RENAMED Viewed

File without changes

hydroserverpy 0.5.0b3__py3-none-any.whl → 0.5.0b5__py3-none-any.whl

Potentially problematic release.

hydroserverpy 0.5.0b3py3-none-any.whl → 0.5.0b5py3-none-any.whl