PyPI - pygidata - Versions diffs - 0.4.0.dev0__py3-none-any.whl - Mend

pygidata 0.4.0.dev0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (26) hide show

gi_data/__init__.py +3 -0
gi_data/dataclient.py +380 -0
gi_data/drivers/__init__.py +0 -0
gi_data/drivers/base.py +114 -0
gi_data/drivers/cloud_gql.py +453 -0
gi_data/drivers/kafka_stream.py +95 -0
gi_data/drivers/local_http.py +284 -0
gi_data/drivers/ws_stream.py +137 -0
gi_data/infra/__init__.py +0 -0
gi_data/infra/auth.py +132 -0
gi_data/infra/http.py +130 -0
gi_data/infra/ws.py +92 -0
gi_data/mapping/__init__.py +0 -0
gi_data/mapping/enums.py +36 -0
gi_data/mapping/models.py +255 -0
gi_data/mysql_connect.py +90 -0
gi_data/utils/__init__.py +0 -0
gi_data/utils/logging.py +37 -0
gi_data/utils.py +62 -0
gi_data/ws/__init__.py +0 -0
gi_data/ws/enums.py +34 -0
pygidata-0.4.0.dev0.dist-info/METADATA +238 -0
pygidata-0.4.0.dev0.dist-info/RECORD +26 -0
pygidata-0.4.0.dev0.dist-info/WHEEL +5 -0
pygidata-0.4.0.dev0.dist-info/licenses/LICENSE +21 -0
pygidata-0.4.0.dev0.dist-info/top_level.txt +1 -0

gi_data/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+from .dataclient import GIDataClient
+__all__: list[str] = ["GIDataClient"]

gi_data/dataclient.py ADDED Viewed

@@ -0,0 +1,380 @@
+# src/src/dataclient.py
+from __future__ import annotations
+import asyncio
+import inspect
+import logging
+from typing import Any, Dict, List, Optional, Tuple, Union, Type, Iterable
+from uuid import UUID
+import nest_asyncio
+import pandas as pd
+from gi_data.drivers.base import BaseDriver
+from gi_data.drivers.cloud_gql import CloudGQLDriver
+from gi_data.drivers.kafka_stream import KafkaStreamDriver
+from gi_data.drivers.local_http import HTTPTimeSeriesDriver
+from gi_data.drivers.ws_stream import WebSocketDriver
+from gi_data.infra.auth import AuthManager
+from gi_data.infra.http import AsyncHTTP
+from gi_data.mapping.enums import Resolution, DataType, DataFormat
+from gi_data.mapping.models import (GIStream, GIStreamVariable,
+                                    GIOnlineVariable, VarSelector,
+                                    CSVSettings, LogSettings,
+                                    CSVImportSettings, GIHistoryMeasurement)
+from gi_data.utils.logging import setup_module_logger
+logger = setup_module_logger(__name__, level=logging.DEBUG)
+PACKAGE_PREFIX = "gi_data"
+# ------------------------------------------------------------------ #
+# helpers                                                            #
+# ------------------------------------------------------------------ #
+asyncio.set_event_loop(asyncio.new_event_loop())
+def _to_task(fut, as_task, loop):
+    if not as_task or isinstance(fut, asyncio.Task):
+        return fut
+    return loop.create_task(fut)
+def _run(fut, as_task=True):
+    try:
+        loop = asyncio.get_running_loop()
+    except RuntimeError:
+        loop = asyncio.new_event_loop()
+        asyncio.set_event_loop(loop)
+        return loop.run_until_complete(_to_task(fut, as_task, loop))
+    else:
+        nest_asyncio.apply(loop)
+        return loop.run_until_complete(_to_task(fut, as_task, loop))
+class GIDataClient:
+    """
+    High-level synchronous interface for GI Data-API.
+    """
+    def __init__(
+            self,
+            base_url: str,
+            *,
+            username: Optional[str] = None,
+            password: Optional[str] = None,
+            access_token: Optional[str] = None,
+            driver_cls: Type = HTTPTimeSeriesDriver,
+            driver_kwargs: Optional[dict] = None,
+    ) -> None:
+        self._kafka = None
+        self._auth = AuthManager(base_url, username, password, access_token=access_token)
+        self._http = AsyncHTTP(base_url, self._auth)
+        driver_kwargs = driver_kwargs or {}
+        # ------------------------------------------------------------------
+        # driver factory that only passes supported ctor-arguments
+        # ------------------------------------------------------------------
+        def _build_driver(domain: str):
+            sig = inspect.signature(driver_cls)  # ctor signature
+            kw: Dict[str, Any] = {"client_id": None, **driver_kwargs}
+            # only add "domain" if the driver accepts it
+            if "domain" in sig.parameters:
+                kw["domain"] = domain
+            kw = {k: v for k, v in kw.items() if k in sig.parameters}
+            return driver_cls(self._auth, self._http, **kw)
+        # domain drivers
+        cloud_env = self._auth.is_cloud_environment()
+        buffer_driver = CloudGQLDriver(self._auth, self._http) if cloud_env \
+            else HTTPTimeSeriesDriver(self._auth, self._http, None, "buffer")
+        history_driver = CloudGQLDriver(self._auth, self._http) if cloud_env \
+            else HTTPTimeSeriesDriver(self._auth, self._http, None, "history")
+        self._drivers: Dict[str, BaseDriver] = {
+            "buffer": buffer_driver,  # ← cloud => GQL Raw
+            "history": history_driver,
+        }
+        self._ws_driver: Optional[WebSocketDriver] = None
+    # --------------------------- online ------------------------------ #
+    def list_variables(self) -> List[GIOnlineVariable]:
+        return _run(self._drivers["buffer"].list_variables())
+    def read_online(self, var_ids: List[UUID]) -> Dict[UUID, float]:
+        return _run(self._drivers["buffer"].read(var_ids))
+    def write_online(self, mapping: Dict[UUID, float]) -> None:
+        _run(self._drivers["buffer"].write(mapping))
+    # --------------------------- buffer ------------------------------ #
+    def list_buffer_sources(self) -> List[GIStream]:
+        return _run(self._drivers["buffer"].list_buffer_sources())
+    def list_buffer_variables(self, source_id: Union[UUID, int]) -> List[GIStreamVariable]:
+        return _run(self._drivers["buffer"].list_buffer_variables(source_id))
+    def fetch_buffer(
+            self,
+            selectors: List[VarSelector],
+            *,
+            start_ms: float = -20_000,
+            end_ms: float = 0,
+            points: int = 2048,
+    ) -> pd.DataFrame:
+        return _run(
+            self._drivers["buffer"].fetch_buffer(
+                selectors, start_ms=start_ms, end_ms=end_ms, points=points
+            )
+        )
+    # --------------------------- history ----------------------------- #
+    def list_history_sources(self) -> List[GIStream]:
+        return _run(self._drivers["history"].list_buffer_sources())
+    def list_history_variables(self, source_id: Union[UUID, int]):
+        return _run(self._drivers["history"].list_buffer_variables(source_id))
+    def list_history_measurements(
+            self,
+            source_id: Union[str, int, UUID],
+            *,
+            start: Optional[int] = None,
+            end: Optional[int] = None,
+            order: str = "DESC",
+            limit: Optional[int] = None,
+            measurements: Optional[Iterable[Union[str, UUID]]] = None,
+            add_var_mapping: bool = True,
+            add_meas_metadata: bool = False,
+            meas_metadata_filter: Optional[List[dict]] = None,
+    ) -> List[GIHistoryMeasurement]:
+        result = _run(
+            self._drivers["history"].list_measurements(
+                source_id,
+                start=start,
+                end=end,
+                order=order,
+                limit=limit,
+                measurements=measurements,
+                add_var_mapping=add_var_mapping,
+                add_meas_metadata=add_meas_metadata,
+                meas_metadata_filter=meas_metadata_filter,
+            )
+        )
+        # Attach client to enable selected_meas.vars lazy variable resolution
+        return [m.attach_client(self) for m in result]
+    def fetch_history(
+            self,
+            selectors: List[VarSelector],
+            measurement_id: UUID,
+            *,
+            start_ms: float = 0,
+            end_ms: float = 0,
+            points: int = 2048,
+    ) -> pd.DataFrame:
+        return _run(
+            self._drivers["history"].fetch_history(
+                selectors,
+                measurement_id=measurement_id,
+                start_ms=start_ms,
+                end_ms=end_ms,
+                points=points,
+            )
+        )
+    # -------------------------- websocket ---------------------------- #
+    async def stream_online(
+            self,
+            var_ids: List[UUID],
+            *,
+            interval_ms: int = 1,
+            extended: bool = True,
+            on_change: bool = True,
+            precision: int = -1,
+    ):
+        driver = await self._ensure_ws_driver()
+        async for tick in driver.stream_online(
+                var_ids,
+                interval_ms=interval_ms,
+                extended=extended,
+                on_change=on_change,
+                precision=precision,
+        ):
+            yield tick
+    async def publish_online(
+            self,
+            data: Dict[UUID, float] | List[Tuple[UUID, float]],
+            *,
+            function: str = "write",
+    ) -> None:
+        driver = await self._ensure_ws_driver()
+        await driver.publish(data, function=function)
+    async def _ensure_ws_driver(self) -> WebSocketDriver:
+        if self._ws_driver is None:
+            from gi_data.infra.ws import AsyncWS
+            ws = AsyncWS(self._http.base_url, self._auth)
+            self._ws_driver = WebSocketDriver(self._auth, ws, self._http)
+        return self._ws_driver
+    # ---------------------------- kafka ------------------------------ #
+    async def stream_kafka(
+            self,
+            var_ids: List[UUID],
+            *,
+            ssl: bool = False,
+            group_id: str = "gi_data_client",
+    ):
+        driver = await self._ensure_kafka_driver()
+        logger.debug(f"Kafka driver: {driver}")
+        async for update in driver.stream(var_ids, ssl=ssl, group_id=group_id):
+            logger.debug("Kafka update: %s", update)
+            yield update
+    async def _ensure_kafka_driver(self) -> KafkaStreamDriver:
+        if self._kafka is None:
+            from gi_data.drivers.kafka_stream import KafkaStreamDriver
+            self._kafka = KafkaStreamDriver(self._auth, self._http)
+        return self._kafka
+    # --------------------------- export ------------------------------- #
+    def export_data(
+            self,
+            selectors: List[VarSelector],
+            *,
+            start_ms: float,
+            end_ms: float,
+            format: DataFormat,
+            points: Optional[int] = None,
+            timezone: str = "UTC",
+            resolution: Optional[Resolution] = None,
+            data_type: Optional[DataType] = None,
+            aggregation: Optional[str] = None,
+            date_format: Optional[str] = None,
+            filename: Optional[str] = None,
+            precision: int = -1,
+            csv_settings: Optional[CSVSettings] = None,
+            log_settings: Optional[LogSettings] = None,
+            target: Optional[str] = None,
+    ) -> bytes:
+        drv = self._drivers["buffer"]
+        if format.value not in drv.supported_exports():
+            raise NotImplementedError(f"{drv.name} does not support {format.value}")
+        return _run(
+            drv.export(
+                selectors,
+                start_ms=start_ms,
+                end_ms=end_ms,
+                format=format.value,
+                points=points,
+                timezone=timezone,
+                resolution=resolution.value if resolution else None,
+                data_type=data_type.value if data_type else None,
+                aggregation=aggregation,
+                date_format=date_format,
+                filename=filename,
+                precision=precision,
+                csv_settings=csv_settings,
+                log_settings=log_settings,
+                target=target,
+            )
+        )
+    # convenience
+    def export_csv(self, selectors, *, start_ms, end_ms, **kw) -> bytes:
+        return self.export(selectors, start_ms=start_ms, end_ms=end_ms,
+                           format=DataFormat.CSV, **kw)
+    def export_udbf(self, selectors, *, start_ms, end_ms, **kw) -> bytes:
+        return self.export(selectors, start_ms=start_ms, end_ms=end_ms,
+                           format=DataFormat.UDBF, **kw)
+    # --------------------------- import ------------------------------- #
+    def import_data(
+            self,
+            source_id: str,
+            source_name: str,
+            file_bytes: bytes,
+            *,
+            format: DataFormat,
+            target: str = "stream",  # "stream" | "record" - only stream on cloud
+            csv_settings: Optional[CSVImportSettings] = None,
+            add_time_series: bool = False,
+            retention_time_sec: int = 0,
+            time_offset_sec: int = 0,
+            sample_rate: int = -1,
+            auto_create_metadata: bool = True,
+            session_timeout_sec: int = 300,
+    ) -> str:
+        drv = self._drivers["history"]
+        if format == DataFormat.CSV:
+            return _run(
+                drv.import_csv(
+                    source_id,
+                    source_name,
+                    file_bytes,
+                    target=target,
+                    csv_settings=csv_settings,
+                    add_time_series=add_time_series,
+                    retention_time_sec=retention_time_sec,
+                    time_offset_sec=time_offset_sec,
+                    sample_rate=sample_rate,
+                    auto_create_metadata=auto_create_metadata,
+                    session_timeout_sec=session_timeout_sec,
+                )
+            )
+        if format == DataFormat.UDBF:
+            return _run(
+                drv.import_udbf(
+                    source_id,
+                    source_name,
+                    file_bytes,
+                    target=target,
+                    add_time_series=add_time_series,
+                    sample_rate=sample_rate,
+                    auto_create_metadata=auto_create_metadata,
+                    session_timeout_sec=session_timeout_sec,
+                )
+            )
+        raise NotImplementedError(f"Import for format={format} not supported.")
+    def import_csv(self, source_id, source_name, file_bytes, **kw) -> str:
+        return self.import_(source_id, source_name, file_bytes, format=DataFormat.CSV, **kw)
+    def import_udbf(self, source_id, source_name, file_bytes, **kw) -> str:
+        return self.import_(source_id, source_name, file_bytes, format=DataFormat.UDBF, **kw)
+    # ------------------------ housekeeping --------------------------- #
+    def close(self) -> None:
+        _run(self._http.aclose())
+    def __enter__(self) -> "GIDataClient":
+        return self
+    def __exit__(self, exc_type, exc, tb) -> bool:
+        self.close()
+        return False
+    @staticmethod
+    def set_log_level(level: int):
+        root = logging.getLogger(PACKAGE_PREFIX)
+        root.setLevel(level)  # affects children that don't explicitly override
+        # ensure already-created module loggers are updated, too
+        for name, lg in logging.root.manager.loggerDict.items():
+            if isinstance(lg, logging.Logger) and name.startswith(PACKAGE_PREFIX):
+                lg.setLevel(level)

gi_data/drivers/__init__.py ADDED Viewed

File without changes

gi_data/drivers/base.py ADDED Viewed

@@ -0,0 +1,114 @@
+from __future__ import annotations
+import abc
+from typing import AsyncIterator, Dict, List, Literal, Optional
+from uuid import UUID
+import pandas as pd
+from gi_data.mapping.models import LogSettings, CSVSettings, VarSelector
+class BaseDriver(abc.ABC):
+    """
+    Abstract transport driver.
+    Concrete subclasses implement only the subset of methods
+    their protocol / product family supports.
+    """
+    priority: int = 10
+    name: str = "base"
+    def __init__(self, auth_manager, http_client, ws_client) -> None:
+        self.auth = auth_manager
+        self.http = http_client
+        self.ws = ws_client
+    # ----------------------------  ONLINE  --------------------------------
+    async def list_variables(self) -> List["Variable"]:  # noqa: F821
+        """Return metadata for every online variable."""
+        raise NotImplementedError
+    async def read(self, var_ids: List[UUID]) -> Dict[UUID, float]:
+        """Read current online values for a list of UUIDs."""
+        raise NotImplementedError
+    async def write(self, mapping: Dict[UUID, float]) -> None:
+        """Write values to online variables."""
+        raise NotImplementedError
+    # ----------------------------  BUFFER  --------------------------------
+    async def list_buffer_sources(self) -> List["Source"]:  # noqa: F821
+        """Return buffer-stream definitions."""
+        raise NotImplementedError
+    async def list_buffer_variables(self, source_id) -> List["GIStreamVariable"]:  # noqa: F821
+        """Return buffer-stream variables."""
+        raise NotImplementedError
+    async def fetch_buffer(self, *args, **kwargs) -> "TimeSeriesFrame":  # noqa: F821
+        """Fetch equidistant or absolute buffer data."""
+        raise NotImplementedError
+    # ---------------------------  HISTORY  --------------------------------
+    async def list_measurements(self, *args, **kwargs) -> List["Measurement"]:  # noqa: F821
+        """Return measurements inside a history source."""
+        raise NotImplementedError
+    async def fetch_history(self, *args, **kwargs) -> "TimeSeriesFrame":  # noqa: F821
+        """Read historical data within a time window."""
+        raise NotImplementedError
+    # ---------------------------  STREAMING  ------------------------------
+    def stream(
+            self, worker: str, **cfg
+    ) -> AsyncIterator[pd.DataFrame]:  # pragma: no cover
+        """
+        Subscribe to a WebSocket worker and yield DataFrame chunks.
+        Implementation is optional; drivers that do not support WebSocket
+        simply raise `NotImplementedError`.
+        """
+        raise NotImplementedError
+    async def export_data(
+            self,
+            selectors: List["VarSelector"],
+            *,
+            start_ms: float,
+            end_ms: float,
+            format: Literal["csv", "udbf"],
+            points: Optional[int] = None,
+            timezone: str = "UTC",
+            aggregation: Optional[str] = None,
+            date_format: Optional[str] = None,
+            filename: Optional[str] = None,
+            precision: int = -1,
+            csv_settings: Optional["CSVSettings"] = None,
+            log_settings: Optional["LogSettings"] = None,
+            target: Optional[str] = None,
+    ) -> bytes:
+        raise NotImplementedError
+    def supported_exports(self) -> set[str]:
+        return {"csv", "udbf"}
+    def import_csv(self, source_id, source_name, file_bytes, target,
+                   csv_settings, add_time_series, retention_time_sec,
+                   time_offset_sec, sample_rate, auto_create_metadata, session_timeout_sec):
+        pass
+    def import_udbf(self, source_id, source_name, file_bytes,
+                    target, add_time_series, sample_rate,
+                    auto_create_metadata, session_timeout_sec):
+        pass
+    def export(self, selectors, start_ms, end_ms, format, points,
+               timezone, resolution, data_type, aggregation,
+               date_format, filename, precision, csv_settings, log_settings, target):
+        pass