PyPI - hydroserverpy - Versions diffs - 0.2.5__py3-none-any.whl → 0.4.0__py3-none-any.whl - Mend

hydroserverpy 0.2.5py3-none-any.whl → 0.4.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of hydroserverpy might be problematic. Click here for more details.

Files changed (77) hide show

hydroserverpy/__init__.py +6 -15
hydroserverpy/core/endpoints/__init__.py +9 -0
hydroserverpy/core/endpoints/base.py +146 -0
hydroserverpy/core/endpoints/data_loaders.py +93 -0
hydroserverpy/core/endpoints/data_sources.py +93 -0
hydroserverpy/core/endpoints/datastreams.py +225 -0
hydroserverpy/core/endpoints/observed_properties.py +111 -0
hydroserverpy/core/endpoints/processing_levels.py +111 -0
hydroserverpy/core/endpoints/result_qualifiers.py +111 -0
hydroserverpy/core/endpoints/sensors.py +111 -0
hydroserverpy/core/endpoints/things.py +261 -0
hydroserverpy/core/endpoints/units.py +111 -0
hydroserverpy/{components → core/schemas}/__init__.py +1 -2
hydroserverpy/core/schemas/base.py +124 -0
hydroserverpy/core/schemas/data_loaders.py +73 -0
hydroserverpy/core/schemas/data_sources.py +223 -0
hydroserverpy/core/schemas/datastreams.py +330 -0
hydroserverpy/core/schemas/observed_properties.py +43 -0
hydroserverpy/core/schemas/processing_levels.py +31 -0
hydroserverpy/core/schemas/result_qualifiers.py +26 -0
hydroserverpy/core/schemas/sensors.py +68 -0
hydroserverpy/core/schemas/things.py +346 -0
hydroserverpy/core/schemas/units.py +29 -0
hydroserverpy/core/service.py +200 -0
hydroserverpy/etl/__init__.py +21 -0
hydroserverpy/etl/extractors/__init__.py +0 -0
hydroserverpy/etl/extractors/base.py +13 -0
hydroserverpy/etl/extractors/ftp_extractor.py +50 -0
hydroserverpy/etl/extractors/http_extractor.py +84 -0
hydroserverpy/etl/extractors/local_file_extractor.py +25 -0
hydroserverpy/etl/hydroserver_etl.py +40 -0
hydroserverpy/etl/loaders/__init__.py +0 -0
hydroserverpy/etl/loaders/base.py +13 -0
hydroserverpy/etl/loaders/hydroserver_loader.py +68 -0
hydroserverpy/etl/transformers/__init__.py +0 -0
hydroserverpy/etl/transformers/base.py +52 -0
hydroserverpy/etl/transformers/csv_transformer.py +88 -0
hydroserverpy/etl/transformers/json_transformer.py +62 -0
hydroserverpy/etl/types.py +7 -0
hydroserverpy/etl_csv/__init__.py +0 -0
hydroserverpy/{etl.py → etl_csv/hydroserver_etl_csv.py} +118 -95
hydroserverpy/quality/__init__.py +1 -0
hydroserverpy/quality/service.py +405 -0
hydroserverpy-0.4.0.dist-info/METADATA +18 -0
hydroserverpy-0.4.0.dist-info/RECORD +51 -0
{hydroserverpy-0.2.5.dist-info → hydroserverpy-0.4.0.dist-info}/WHEEL +1 -1
hydroserverpy/components/data_loaders.py +0 -67
hydroserverpy/components/data_sources.py +0 -98
hydroserverpy/components/datastreams.py +0 -47
hydroserverpy/components/observed_properties.py +0 -48
hydroserverpy/components/processing_levels.py +0 -48
hydroserverpy/components/result_qualifiers.py +0 -48
hydroserverpy/components/sensors.py +0 -48
hydroserverpy/components/things.py +0 -48
hydroserverpy/components/units.py +0 -48
hydroserverpy/components/users.py +0 -28
hydroserverpy/main.py +0 -62
hydroserverpy/models.py +0 -218
hydroserverpy/schemas/data_loaders.py +0 -27
hydroserverpy/schemas/data_sources.py +0 -58
hydroserverpy/schemas/datastreams.py +0 -56
hydroserverpy/schemas/observed_properties.py +0 -33
hydroserverpy/schemas/processing_levels.py +0 -33
hydroserverpy/schemas/result_qualifiers.py +0 -32
hydroserverpy/schemas/sensors.py +0 -39
hydroserverpy/schemas/things.py +0 -107
hydroserverpy/schemas/units.py +0 -32
hydroserverpy/schemas/users.py +0 -28
hydroserverpy/service.py +0 -170
hydroserverpy/utils.py +0 -37
hydroserverpy-0.2.5.dist-info/METADATA +0 -15
hydroserverpy-0.2.5.dist-info/RECORD +0 -35
/hydroserverpy/{schemas → core}/__init__.py +0 -0
/hydroserverpy/{exceptions.py → etl_csv/exceptions.py} +0 -0
{hydroserverpy-0.2.5.dist-info → hydroserverpy-0.4.0.dist-info}/LICENSE +0 -0
{hydroserverpy-0.2.5.dist-info → hydroserverpy-0.4.0.dist-info}/top_level.txt +0 -0
{hydroserverpy-0.2.5.dist-info → hydroserverpy-0.4.0.dist-info}/zip-safe +0 -0

hydroserverpy/{etl.py → etl_csv/hydroserver_etl_csv.py} RENAMED Viewed

@@ -1,33 +1,39 @@
 import csv
 import logging
-import frost_sta_client as fsc
 import croniter
-from typing import IO, List
+import pandas as pd
+from typing import IO, List, TYPE_CHECKING
+from requests import HTTPError
 from datetime import datetime, timezone, timedelta
 from dateutil.parser import isoparse
-from .schemas.data_sources import DataSourceGetResponse
-from .schemas.datastreams import DatastreamGetResponse
 from .exceptions import HeaderParsingError, TimestampParsingError
-from .schemas.data_sources import DataSourcePatchBody
+import warnings
-logger = logging.getLogger('hydroserver_etl')
+if TYPE_CHECKING:
+    from ..core.schemas import DataSource
+logger = logging.getLogger("hydroserver_etl")
 logger.addHandler(logging.NullHandler())
-class HydroServerETL:
+class HydroServerETLCSV:
     def __init__(
-            self,
-            service,
-            data_file: IO[str],
-            data_source: DataSourceGetResponse,
-            datastreams: List[DatastreamGetResponse]
+        self,
+        service,
+        data_file: IO[str],
+        data_source: "DataSource",
     ):
+        warnings.warn(
+            "HydroServerETLCSV is deprecated and will be removed in a future version. "
+            "Please use the new HydroServerETL class.",
+            DeprecationWarning,
+        )
         self._service = service
         self._data_file = data_file
         self._data_source = data_source
         self._datastreams = {
-            datastream.id: datastream for datastream in datastreams
+            datastream.uid: datastream for datastream in data_source.datastreams
         }
         self._timestamp_column_index = None
@@ -66,12 +72,12 @@ class HydroServerETL:
                     self._failed_datastreams.extend(self._post_observations())
         except HeaderParsingError as e:
-            self._message = f'Failed to parse header for {self._data_source.name} with error: {str(e)}'
+            self._message = f"Failed to parse header for {self._data_source.name} with error: {str(e)}"
             logger.error(self._message)
             self._file_header_error = True
         except TimestampParsingError as e:
-            self._message = f'Failed to parse one or more timestamps for {self._data_source.name} with error: {str(e)}'
+            self._message = f"Failed to parse one or more timestamps for {self._data_source.name} with error: {str(e)}"
             logger.error(self._message)
             self._file_timestamp_error = True
@@ -79,7 +85,7 @@ class HydroServerETL:
         self._failed_datastreams.extend(self._post_observations())
         if not self._message and len(self._failed_datastreams) > 0:
-            self._message = f'One or more datastreams failed to sync with HydroServer for {self._data_source.name}.'
+            self._message = f"One or more datastreams failed to sync with HydroServer for {self._data_source.name}."
         self._update_data_source()
@@ -99,7 +105,8 @@ class HydroServerETL:
         """
         if index == self._data_source.header_row or (
-                index == self._data_source.data_start_row and self._timestamp_column_index is None
+            index == self._data_source.data_start_row
+            and self._timestamp_column_index is None
         ):
             self._parse_file_header(row)
@@ -109,19 +116,30 @@ class HydroServerETL:
         timestamp = self._parse_row_timestamp(row)
         for datastream in self._datastreams.values():
-            if str(datastream.id) not in self._datastream_start_row_indexes.keys():
-                if not datastream.phenomenon_end_time or timestamp > datastream.phenomenon_end_time:
-                    self._datastream_start_row_indexes[str(datastream.id)] = index
-            if str(datastream.id) in self._datastream_start_row_indexes.keys() \
-                    and self._datastream_start_row_indexes[str(datastream.id)] <= index:
-                if str(datastream.id) not in self._observations.keys():
-                    self._observations[str(datastream.id)] = []
-                self._observations[str(datastream.id)].append({
-                    'phenomenon_time': timestamp,
-                    'result': row[self._datastream_column_indexes[datastream.data_source_column]]
-                })
+            if str(datastream.uid) not in self._datastream_start_row_indexes.keys():
+                if (
+                    not datastream.phenomenon_end_time
+                    or timestamp > datastream.phenomenon_end_time
+                ):
+                    self._datastream_start_row_indexes[str(datastream.uid)] = index
+            if (
+                str(datastream.uid) in self._datastream_start_row_indexes.keys()
+                and self._datastream_start_row_indexes[str(datastream.uid)] <= index
+            ):
+                if str(datastream.uid) not in self._observations.keys():
+                    self._observations[str(datastream.uid)] = []
+                self._observations[str(datastream.uid)].append(
+                    {
+                        "phenomenon_time": timestamp,
+                        "result": row[
+                            self._datastream_column_indexes[
+                                datastream.data_source_column
+                            ]
+                        ],
+                    }
+                )
     def _parse_file_header(self, row: List[str]) -> None:
         """
@@ -136,22 +154,29 @@ class HydroServerETL:
         """
         try:
-            self._timestamp_column_index = row.index(self._data_source.timestamp_column) \
-                if isinstance(self._data_source.timestamp_column, str) \
+            self._timestamp_column_index = (
+                row.index(self._data_source.timestamp_column)
+                if isinstance(self._data_source.timestamp_column, str)
                 else int(self._data_source.timestamp_column) - 1
+            )
             if self._timestamp_column_index > len(row):
                 raise ValueError
             self._datastream_column_indexes = {
-                datastream.data_source_column: row.index(datastream.data_source_column)
-                if not datastream.data_source_column.isdigit()
-                else int(datastream.data_source_column) - 1
+                datastream.data_source_column: (
+                    row.index(datastream.data_source_column)
+                    if not datastream.data_source_column.isdigit()
+                    else int(datastream.data_source_column) - 1
+                )
                 for datastream in self._datastreams.values()
             }
-            if len(self._datastream_column_indexes.values()) > 0 and \
-                    max(self._datastream_column_indexes.values()) > len(row):
+            if len(self._datastream_column_indexes.values()) > 0 and max(
+                self._datastream_column_indexes.values()
+            ) > len(row):
                 raise ValueError
         except ValueError as e:
-            logger.error(f'Failed to load data from data source: "{self._data_source.name}"')
+            logger.error(
+                f'Failed to load data from data source: "{self._data_source.name}"'
+            )
             raise HeaderParsingError(str(e)) from e
     def _parse_row_timestamp(self, row: List[str]) -> datetime:
@@ -164,32 +189,36 @@ class HydroServerETL:
         """
         try:
-            if self._data_source.timestamp_format == 'iso' or self._data_source.timestamp_format is None:
-                timestamp = isoparse(
-                    row[self._timestamp_column_index]
-                )
+            if (
+                self._data_source.timestamp_format == "iso"
+                or self._data_source.timestamp_format is None
+            ):
+                timestamp = isoparse(row[self._timestamp_column_index])
             else:
                 timestamp = datetime.strptime(
                     row[self._timestamp_column_index],
-                    self._data_source.timestamp_format
+                    self._data_source.timestamp_format,
                 )
         except ValueError as e:
             raise TimestampParsingError(str(e)) from e
         if timestamp.tzinfo is None:
             if not self._data_source.timestamp_offset:
-                timestamp = timestamp.replace(
-                    tzinfo=timezone.utc
-                )
+                timestamp = timestamp.replace(tzinfo=timezone.utc)
             else:
                 try:
                     timestamp = timestamp.replace(
                         tzinfo=datetime.strptime(
-                            self._data_source.timestamp_offset[:-2] + ':' + self._data_source.timestamp_offset[3:], '%z'
+                            self._data_source.timestamp_offset[:-2]
+                            + ":"
+                            + self._data_source.timestamp_offset[3:],
+                            "%z",
                         ).tzinfo
                     )
                 except ValueError as e:
-                    logger.error(f'Failed to load data from data source: "{self._data_source.name}"')
+                    logger.error(
+                        f'Failed to load data from data source: "{self._data_source.name}"'
+                    )
                     raise TimestampParsingError(str(e)) from e
         return timestamp
@@ -213,47 +242,41 @@ class HydroServerETL:
             if datastream_id not in self._failed_datastreams and len(observations) > 0:
                 logger.info(
-                    f'Loading observations from ' +
-                    f'{observations[0]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} to ' +
-                    f'{observations[-1]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} for datastream: ' +
-                    f'{str(datastream_id)} in data source "{self._data_source.name}".'
+                    f"Loading observations from "
+                    + f'{observations[0]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} to '
+                    + f'{observations[-1]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} for datastream: '
+                    + f'{str(datastream_id)} in data source "{self._data_source.name}".'
                 )
-                data_array_value = getattr(fsc.model, 'ext').data_array_value.DataArrayValue()
-                datastream = fsc.Datastream(id=datastream_id)
-                components = {data_array_value.Property.PHENOMENON_TIME, data_array_value.Property.RESULT}
-                data_array_value.datastream = datastream
-                data_array_value.components = components
-                for observation in observations:
-                    data_array_value.add_observation(fsc.Observation(
-                        phenomenon_time=observation['phenomenon_time'].strftime('%Y-%m-%dT%H:%M:%S%z'),
-                        result=observation['result'],
-                        datastream=datastream
-                    ))
-                data_array_document = getattr(fsc.model, 'ext').data_array_document.DataArrayDocument()
-                data_array_document.add_data_array_value(data_array_value)
+                observations_df = pd.DataFrame(
+                    [
+                        [observation["phenomenon_time"], observation["result"]]
+                        for observation in observations
+                    ],
+                    columns=["timestamp", "value"],
+                )
                 try:
-                    self._service.sensorthings.observations().create(data_array_document)
-                except KeyError:
+                    self._service.datastreams.load_observations(
+                        uid=datastream_id,
+                        observations=observations_df,
+                    )
+                except HTTPError:
                     failed_datastreams.append(datastream_id)
                 if not self._last_loaded_timestamp or (
-                        observations[-1]['phenomenon_time'] and observations[-1]['phenomenon_time'] >
-                        self._last_loaded_timestamp
+                    observations[-1]["phenomenon_time"]
+                    and observations[-1]["phenomenon_time"]
+                    > self._last_loaded_timestamp
                 ):
-                    self._last_loaded_timestamp = observations[-1]['phenomenon_time']
+                    self._last_loaded_timestamp = observations[-1]["phenomenon_time"]
             elif datastream_id in self._failed_datastreams:
                 logger.info(
-                    f'Skipping observations POST request from ' +
-                    f'{observations[0]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} to ' +
-                    f'{observations[-1]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} for datastream: ' +
-                    f'{str(datastream_id)} in data source "{self._data_source.name}",' +
-                    f'due to previous failed POST request.'
+                    f"Skipping observations POST request from "
+                    + f'{observations[0]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} to '
+                    + f'{observations[-1]["phenomenon_time"].strftime("%Y-%m-%dT%H:%M:%S%z")} for datastream: '
+                    + f'{str(datastream_id)} in data source "{self._data_source.name}",'
+                    + f"due to previous failed POST request."
                 )
         self._observations = {}
@@ -270,28 +293,28 @@ class HydroServerETL:
         if self._data_source.crontab is not None:
             next_sync = croniter.croniter(
-                self._data_source.crontab,
-                datetime.now()
+                self._data_source.crontab, datetime.now()
             ).get_next(datetime)
-        elif self._data_source.interval is not None and self._data_source.interval_units is not None:
+        elif (
+            self._data_source.interval is not None
+            and self._data_source.interval_units is not None
+        ):
             next_sync = datetime.now() + timedelta(
                 **{self._data_source.interval_units: self._data_source.interval}
             )
         else:
             next_sync = None
-        updated_data_source = DataSourcePatchBody(
-            data_source_thru=self._last_loaded_timestamp,
-            last_sync_successful=(
-                True if not self._file_timestamp_error and not self._file_header_error
-                and len(self._failed_datastreams) == 0 else False
-            ),
-            last_sync_message=self._message,
-            last_synced=datetime.now(timezone.utc),
-            next_sync=next_sync
+        self._data_source.data_source_thru = self._last_loaded_timestamp
+        self._data_source.last_sync_successful = (
+            True
+            if not self._file_timestamp_error
+            and not self._file_header_error
+            and len(self._failed_datastreams) == 0
+            else False
         )
+        self._data_source.last_sync_message = self._message
+        self._data_source.last_synced = datetime.now(timezone.utc)
+        self._data_source.next_sync = next_sync
-        self._service.data_sources.update(
-            data_source_id=str(self._data_source.id),
-            data_source_body=updated_data_source
-        )
+        self._data_source.save()

hydroserverpy/quality/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ from .service import HydroServerQualityControl, TimeUnit, FilterOperation, Operator

hydroserverpy 0.2.5__py3-none-any.whl → 0.4.0__py3-none-any.whl

Potentially problematic release.

hydroserverpy 0.2.5py3-none-any.whl → 0.4.0py3-none-any.whl