PyPI - pygazpar - Versions diffs - 1.2.8__py311-none-any.whl → 1.3.0a6__py311-none-any.whl - Mend

pygazpar 1.2.8py311-none-any.whl → 1.3.0a6py311-none-any.whl

Files changed (12) hide show

pygazpar/datasource.py +535 -528
pygazpar/excelparser.py +136 -138
pygazpar/jsonparser.py +1 -1
pygazpar/version.py +1 -1
{pygazpar-1.2.8.dist-info → pygazpar-1.3.0a6.dist-info}/METADATA +6 -43
{pygazpar-1.2.8.dist-info → pygazpar-1.3.0a6.dist-info}/RECORD +12 -12
{pygazpar-1.2.8.dist-info → pygazpar-1.3.0a6.dist-info}/WHEEL +1 -1
tests/test_client.py +145 -159
tests/test_datasource.py +166 -166
{pygazpar-1.2.8.dist-info → pygazpar-1.3.0a6.dist-info}/LICENSE.md +0 -0
{pygazpar-1.2.8.dist-info → pygazpar-1.3.0a6.dist-info}/entry_points.txt +0 -0
{pygazpar-1.2.8.dist-info → pygazpar-1.3.0a6.dist-info}/top_level.txt +0 -0

pygazpar/datasource.py CHANGED Viewed

@@ -1,528 +1,535 @@
-import logging
-import glob
-import os
-import json
-import time
-import pandas as pd
-import http.cookiejar
-from abc import ABC, abstractmethod
-from typing import Any, List, Dict, cast, Optional
-from requests import Session
-from datetime import date, timedelta
-from pygazpar.enum import Frequency, PropertyName
-from pygazpar.excelparser import ExcelParser
-from pygazpar.jsonparser import JsonParser
-SESSION_TOKEN_URL = "https://connexion.grdf.fr/api/v1/authn"
-SESSION_TOKEN_PAYLOAD = """{{
-    "username": "{0}",
-    "password": "{1}",
-    "options": {{
-        "multiOptionalFactorEnroll": "false",
-        "warnBeforePasswordExpired": "false"
-    }}
-}}"""
-AUTH_TOKEN_URL = "https://connexion.grdf.fr/login/sessionCookieRedirect"
-AUTH_TOKEN_PARAMS = """{{
-    "checkAccountSetupComplete": "true",
-    "token": "{0}",
-    "redirectUrl": "https://monespace.grdf.fr"
-}}"""
-Logger = logging.getLogger(__name__)
-MeterReading = Dict[str, Any]
-MeterReadings = List[MeterReading]
-MeterReadingsByFrequency = Dict[str, MeterReadings]
-# ------------------------------------------------------------------------------------------------------------
-class IDataSource(ABC):
-    @abstractmethod
-    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        pass
-# ------------------------------------------------------------------------------------------------------------
-class WebDataSource(IDataSource):
-    # ------------------------------------------------------
-    def __init__(self, username: str, password: str):
-        self.__username = username
-        self.__password = password
-    # ------------------------------------------------------
-    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        self._login(self.__username, self.__password)  # We ignore the return value.
-        res = self._loadFromSession(pceIdentifier, startDate, endDate, frequencies)
-        Logger.debug("The data update terminates normally")
-        return res
-    # ------------------------------------------------------
-    def _login(self, username: str, password: str) -> str:
-        session = Session()
-        session.headers.update({"domain": "grdf.fr"})
-        session.headers.update({"Content-Type": "application/json"})
-        session.headers.update({"X-Requested-With": "XMLHttpRequest"})
-        payload = SESSION_TOKEN_PAYLOAD.format(username, password)
-        response = session.post(SESSION_TOKEN_URL, data=payload)
-        if response.status_code != 200:
-            raise Exception(f"An error occurred while logging in. Status code: {response.status_code} - {response.text}")
-        session_token = response.json().get("sessionToken")
-        Logger.debug("Session token: %s", session_token)
-        jar = http.cookiejar.CookieJar()
-        self._session = Session()
-        self._session.headers.update({"Content-Type": "application/json"})
-        self._session.headers.update({"X-Requested-With": "XMLHttpRequest"})
-        params = json.loads(AUTH_TOKEN_PARAMS.format(session_token))
-        response = self._session.get(AUTH_TOKEN_URL, params=params, allow_redirects=True, cookies=jar)  # type: ignore
-        if response.status_code != 200:
-            raise Exception(f"An error occurred while getting the auth token. Status code: {response.status_code} - {response.text}")
-        auth_token = self._session.cookies.get("auth_token", domain="monespace.grdf.fr")
-        return auth_token  # type: ignore
-    @abstractmethod
-    def _loadFromSession(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        pass
-# ------------------------------------------------------------------------------------------------------------
-class ExcelWebDataSource(WebDataSource):
-    DATA_URL = "https://monespace.grdf.fr/api/e-conso/pce/consommation/informatives/telecharger?dateDebut={0}&dateFin={1}&frequence={3}&pceList[]={2}"
-    DATE_FORMAT = "%Y-%m-%d"
-    FREQUENCY_VALUES = {
-        Frequency.HOURLY: "Horaire",
-        Frequency.DAILY: "Journalier",
-        Frequency.WEEKLY: "Hebdomadaire",
-        Frequency.MONTHLY: "Mensuel",
-        Frequency.YEARLY: "Journalier"
-    }
-    DATA_FILENAME = 'Donnees_informatives_*.xlsx'
-    # ------------------------------------------------------
-    def __init__(self, username: str, password: str, tmpDirectory: str):
-        super().__init__(username, password)
-        self.__tmpDirectory = tmpDirectory
-    # ------------------------------------------------------
-    def _loadFromSession(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        res = {}
-        # XLSX is in the TMP directory
-        data_file_path_pattern = self.__tmpDirectory + '/' + ExcelWebDataSource.DATA_FILENAME
-        # We remove an eventual existing data file (from a previous run that has not deleted it).
-        file_list = glob.glob(data_file_path_pattern)
-        for filename in file_list:
-            if os.path.isfile(filename):
-                try:
-                    os.remove(filename)
-                except PermissionError:
-                    pass
-        if frequencies is None:
-            # Transform Enum in List.
-            frequencyList = [frequency for frequency in Frequency]
-        else:
-            # Get unique values.
-            frequencyList = set(frequencies)
-        for frequency in frequencyList:
-            # Inject parameters.
-            downloadUrl = ExcelWebDataSource.DATA_URL.format(startDate.strftime(ExcelWebDataSource.DATE_FORMAT), endDate.strftime(ExcelWebDataSource.DATE_FORMAT), pceIdentifier, ExcelWebDataSource.FREQUENCY_VALUES[frequency])
-            Logger.debug(f"Loading data of frequency {ExcelWebDataSource.FREQUENCY_VALUES[frequency]} from {startDate.strftime(ExcelWebDataSource.DATE_FORMAT)} to {endDate.strftime(ExcelWebDataSource.DATE_FORMAT)}")
-            # Retry mechanism.
-            retry = 10
-            while retry > 0:
-                try:
-                    self.__downloadFile(self._session, downloadUrl, self.__tmpDirectory)
-                    break
-                except Exception as e:
-                    if retry == 1:
-                        raise e
-                    Logger.error("An error occurred while loading data. Retry in 3 seconds.")
-                    time.sleep(3)
-                    retry -= 1
-            # Load the XLSX file into the data structure
-            file_list = glob.glob(data_file_path_pattern)
-            if len(file_list) == 0:
-                Logger.warning(f"Not any data file has been found in '{self.__tmpDirectory}' directory")
-            for filename in file_list:
-                res[frequency.value] = ExcelParser.parse(filename, frequency if frequency != Frequency.YEARLY else Frequency.DAILY)
-                try:
-                    # openpyxl does not close the file properly.
-                    os.remove(filename)
-                except PermissionError:
-                    pass
-            # We compute yearly from daily data.
-            if frequency == Frequency.YEARLY:
-                res[frequency.value] = FrequencyConverter.computeYearly(res[frequency.value])
-        return res
-    # ------------------------------------------------------
-    def __downloadFile(self, session: Session, url: str, path: str):
-        response = session.get(url)
-        if "text/html" in response.headers.get("Content-Type"):  # type: ignore
-            raise Exception("An error occurred while loading data. Please check your credentials.")
-        if response.status_code != 200:
-            raise Exception(f"An error occurred while loading data. Status code: {response.status_code} - {response.text}")
-        response.raise_for_status()
-        filename = response.headers["Content-Disposition"].split("filename=")[1]
-        open(f"{path}/{filename}", "wb").write(response.content)
-# ------------------------------------------------------------------------------------------------------------
-class ExcelFileDataSource(IDataSource):
-    def __init__(self, excelFile: str):
-        self.__excelFile = excelFile
-    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        res = {}
-        if frequencies is None:
-            # Transform Enum in List.
-            frequencyList = [frequency for frequency in Frequency]
-        else:
-            # Get unique values.
-            frequencyList = set(frequencies)
-        for frequency in frequencyList:
-            if frequency != Frequency.YEARLY:
-                res[frequency.value] = ExcelParser.parse(self.__excelFile, frequency)
-            else:
-                daily = ExcelParser.parse(self.__excelFile, Frequency.DAILY)
-                res[frequency.value] = FrequencyConverter.computeYearly(daily)
-        return res
-# ------------------------------------------------------------------------------------------------------------
-class JsonWebDataSource(WebDataSource):
-    DATA_URL = "https://monespace.grdf.fr/api/e-conso/pce/consommation/informatives?dateDebut={0}&dateFin={1}&pceList[]={2}"
-    TEMPERATURES_URL = "https://monespace.grdf.fr/api/e-conso/pce/{0}/meteo?dateFinPeriode={1}&nbJours={2}"
-    INPUT_DATE_FORMAT = "%Y-%m-%d"
-    OUTPUT_DATE_FORMAT = "%d/%m/%Y"
-    def __init__(self, username: str, password: str):
-        super().__init__(username, password)
-    def _loadFromSession(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        res = {}
-        computeByFrequency = {
-            Frequency.HOURLY: FrequencyConverter.computeHourly,
-            Frequency.DAILY: FrequencyConverter.computeDaily,
-            Frequency.WEEKLY: FrequencyConverter.computeWeekly,
-            Frequency.MONTHLY: FrequencyConverter.computeMonthly,
-            Frequency.YEARLY: FrequencyConverter.computeYearly
-        }
-        # Data URL: Inject parameters.
-        downloadUrl = JsonWebDataSource.DATA_URL.format(startDate.strftime(JsonWebDataSource.INPUT_DATE_FORMAT), endDate.strftime(JsonWebDataSource.INPUT_DATE_FORMAT), pceIdentifier)
-        # Retry mechanism.
-        retry = 10
-        while retry > 0:
-            try:
-                response = self._session.get(downloadUrl)
-                if "text/html" in response.headers.get("Content-Type"):  # type: ignore
-                    raise Exception("An error occurred while loading data. Please check your credentials.")
-                if response.status_code != 200:
-                    raise Exception(f"An error occurred while loading data. Status code: {response.status_code} - {response.text}")
-                break
-            except Exception as e:
-                if retry == 1:
-                    raise e
-                Logger.error("An error occurred while loading data. Retry in 3 seconds.")
-                time.sleep(3)
-                retry -= 1
-        data = response.text
-        Logger.debug("Json meter data: %s", data)
-        # Temperatures URL: Inject parameters.
-        endDate = date.today() - timedelta(days=1) if endDate >= date.today() else endDate
-        days = min((endDate - startDate).days, 730)
-        temperaturesUrl = JsonWebDataSource.TEMPERATURES_URL.format(pceIdentifier, endDate.strftime(JsonWebDataSource.INPUT_DATE_FORMAT), days)
-        # Get weather data.
-        temperatures = self._session.get(temperaturesUrl).text
-        Logger.debug("Json temperature data: %s", temperatures)
-        # Transform all the data into the target structure.
-        daily = JsonParser.parse(data, temperatures, pceIdentifier)
-        Logger.debug("Processed daily data: %s", daily)
-        if frequencies is None:
-            # Transform Enum in List.
-            frequencyList = [frequency for frequency in Frequency]
-        else:
-            # Get unique values.
-            frequencyList = set(frequencies)
-        for frequency in frequencyList:
-            res[frequency.value] = computeByFrequency[frequency](daily)
-        return res
-# ------------------------------------------------------------------------------------------------------------
-class JsonFileDataSource(IDataSource):
-    def __init__(self, consumptionJsonFile: str, temperatureJsonFile):
-        self.__consumptionJsonFile = consumptionJsonFile
-        self.__temperatureJsonFile = temperatureJsonFile
-    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        res = {}
-        with open(self.__consumptionJsonFile) as consumptionJsonFile:
-            with open(self.__temperatureJsonFile) as temperatureJsonFile:
-                daily = JsonParser.parse(consumptionJsonFile.read(), temperatureJsonFile.read(), pceIdentifier)
-        computeByFrequency = {
-            Frequency.HOURLY: FrequencyConverter.computeHourly,
-            Frequency.DAILY: FrequencyConverter.computeDaily,
-            Frequency.WEEKLY: FrequencyConverter.computeWeekly,
-            Frequency.MONTHLY: FrequencyConverter.computeMonthly,
-            Frequency.YEARLY: FrequencyConverter.computeYearly
-        }
-        if frequencies is None:
-            # Transform Enum in List.
-            frequencyList = [frequency for frequency in Frequency]
-        else:
-            # Get unique values.
-            frequencyList = set(frequencies)
-        for frequency in frequencyList:
-            res[frequency.value] = computeByFrequency[frequency](daily)
-        return res
-# ------------------------------------------------------------------------------------------------------------
-class TestDataSource(IDataSource):
-    def __init__(self):
-        pass
-    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
-        res = {}
-        dataSampleFilenameByFrequency = {
-            Frequency.HOURLY: "hourly_data_sample.json",
-            Frequency.DAILY: "daily_data_sample.json",
-            Frequency.WEEKLY: "weekly_data_sample.json",
-            Frequency.MONTHLY: "monthly_data_sample.json",
-            Frequency.YEARLY: "yearly_data_sample.json"
-        }
-        if frequencies is None:
-            # Transform Enum in List.
-            frequencyList = [frequency for frequency in Frequency]
-        else:
-            # Get unique values.
-            frequencyList = set(frequencies)
-        for frequency in frequencyList:
-            dataSampleFilename = f"{os.path.dirname(os.path.abspath(__file__))}/resources/{dataSampleFilenameByFrequency[frequency]}"
-            with open(dataSampleFilename) as jsonFile:
-                res[frequency.value] = cast(List[Dict[PropertyName, Any]], json.load(jsonFile))
-        return res
-# ------------------------------------------------------------------------------------------------------------
-class FrequencyConverter:
-    MONTHS = [
-        "Janvier",
-        "Février",
-        "Mars",
-        "Avril",
-        "Mai",
-        "Juin",
-        "Juillet",
-        "Août",
-        "Septembre",
-        "Octobre",
-        "Novembre",
-        "Décembre"
-    ]
-    # ------------------------------------------------------
-    @staticmethod
-    def computeHourly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
-        return []
-    # ------------------------------------------------------
-    @staticmethod
-    def computeDaily(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
-        return daily
-    # ------------------------------------------------------
-    @staticmethod
-    def computeWeekly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
-        df = pd.DataFrame(daily)
-        # Trimming head and trailing spaces and convert to datetime.
-        df["date_time"] = pd.to_datetime(df["time_period"].str.strip(), format=JsonWebDataSource.OUTPUT_DATE_FORMAT)
-        # Get the first day of week.
-        df["first_day_of_week"] = pd.to_datetime(df["date_time"].dt.strftime("%W %Y 1"), format="%W %Y %w")
-        # Get the last day of week.
-        df["last_day_of_week"] = pd.to_datetime(df["date_time"].dt.strftime("%W %Y 0"), format="%W %Y %w")
-        # Reformat the time period.
-        df["time_period"] = "Du " + df["first_day_of_week"].dt.strftime(JsonWebDataSource.OUTPUT_DATE_FORMAT).astype(str) + " au " + df["last_day_of_week"].dt.strftime(JsonWebDataSource.OUTPUT_DATE_FORMAT).astype(str)
-        # Aggregate rows by month_year.
-        df = df[["first_day_of_week", "time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]].groupby("time_period").agg(first_day_of_week=('first_day_of_week', 'min'), start_index_m3=('start_index_m3', 'min'), end_index_m3=('end_index_m3', 'max'), volume_m3=('volume_m3', 'sum'), energy_kwh=('energy_kwh', 'sum'), timestamp=('timestamp', 'min'), count=('energy_kwh', 'count')).reset_index()
-        # Sort rows by month ascending.
-        df = df.sort_values(by=['first_day_of_week'])
-        # Select rows where we have a full week (7 days) except for the current week.
-        df = pd.concat([df[(df["count"] >= 7)], df.tail(1)[df.tail(1)["count"] < 7]])
-        # Select target columns.
-        df = df[["time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]]
-        res = cast(List[Dict[str, Any]], df.to_dict('records'))
-        return res
-    # ------------------------------------------------------
-    @staticmethod
-    def computeMonthly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
-        df = pd.DataFrame(daily)
-        # Trimming head and trailing spaces and convert to datetime.
-        df["date_time"] = pd.to_datetime(df["time_period"].str.strip(), format=JsonWebDataSource.OUTPUT_DATE_FORMAT)
-        # Get the corresponding month-year.
-        df["month_year"] = df["date_time"].apply(lambda x: FrequencyConverter.MONTHS[x.month - 1]).astype(str) + " " + df["date_time"].dt.strftime("%Y").astype(str)
-        # Aggregate rows by month_year.
-        df = df[["date_time", "month_year", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]].groupby("month_year").agg(first_day_of_month=('date_time', 'min'), start_index_m3=('start_index_m3', 'min'), end_index_m3=('end_index_m3', 'max'), volume_m3=('volume_m3', 'sum'), energy_kwh=('energy_kwh', 'sum'), timestamp=('timestamp', 'min'), count=('energy_kwh', 'count')).reset_index()
-        # Sort rows by month ascending.
-        df = df.sort_values(by=['first_day_of_month'])
-        # Select rows where we have a full month (more than 27 days) except for the current month.
-        df = pd.concat([df[(df["count"] >= 28)], df.tail(1)[df.tail(1)["count"] < 28]])
-        # Rename columns for their target names.
-        df = df.rename(columns={"month_year": "time_period"})
-        # Select target columns.
-        df = df[["time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]]
-        res = cast(List[Dict[str, Any]], df.to_dict('records'))
-        return res
-    # ------------------------------------------------------
-    @staticmethod
-    def computeYearly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
-        df = pd.DataFrame(daily)
-        # Trimming head and trailing spaces and convert to datetime.
-        df["date_time"] = pd.to_datetime(df["time_period"].str.strip(), format=JsonWebDataSource.OUTPUT_DATE_FORMAT)
-        # Get the corresponding year.
-        df["year"] = df["date_time"].dt.strftime("%Y")
-        # Aggregate rows by month_year.
-        df = df[["year", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]].groupby("year").agg(start_index_m3=('start_index_m3', 'min'), end_index_m3=('end_index_m3', 'max'), volume_m3=('volume_m3', 'sum'), energy_kwh=('energy_kwh', 'sum'), timestamp=('timestamp', 'min'), count=('energy_kwh', 'count')).reset_index()
-        # Sort rows by month ascending.
-        df = df.sort_values(by=['year'])
-        # Select rows where we have almost a full year (more than 360) except for the current year.
-        df = pd.concat([df[(df["count"] >= 360)], df.tail(1)[df.tail(1)["count"] < 360]])
-        # Rename columns for their target names.
-        df = df.rename(columns={"year": "time_period"})
-        # Select target columns.
-        df = df[["time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]]
-        res = cast(List[Dict[str, Any]], df.to_dict('records'))
-        return res
+import logging
+import glob
+import os
+import json
+import time
+import pandas as pd
+import http.cookiejar
+from abc import ABC, abstractmethod
+from typing import Any, List, Dict, cast, Optional
+from requests import Session
+from datetime import date, timedelta
+from pygazpar.enum import Frequency, PropertyName
+from pygazpar.excelparser import ExcelParser
+from pygazpar.jsonparser import JsonParser
+SESSION_TOKEN_URL = "https://connexion.grdf.fr/api/v1/authn"
+SESSION_TOKEN_PAYLOAD = """{{
+    "username": "{0}",
+    "password": "{1}",
+    "options": {{
+        "multiOptionalFactorEnroll": "false",
+        "warnBeforePasswordExpired": "false"
+    }}
+}}"""
+AUTH_TOKEN_URL = "https://connexion.grdf.fr/login/sessionCookieRedirect"
+AUTH_TOKEN_PARAMS = """{{
+    "checkAccountSetupComplete": "true",
+    "token": "{0}",
+    "redirectUrl": "https://monespace.grdf.fr"
+}}"""
+Logger = logging.getLogger(__name__)
+MeterReading = Dict[str, Any]
+MeterReadings = List[MeterReading]
+MeterReadingsByFrequency = Dict[str, MeterReadings]
+# ------------------------------------------------------------------------------------------------------------
+class IDataSource(ABC):
+    @abstractmethod
+    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        pass
+# ------------------------------------------------------------------------------------------------------------
+class WebDataSource(IDataSource):
+    # ------------------------------------------------------
+    def __init__(self, username: str, password: str):
+        self.__username = username
+        self.__password = password
+    # ------------------------------------------------------
+    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        auth_token = self._login(self.__username, self.__password)
+        res = self._loadFromSession(auth_token, pceIdentifier, startDate, endDate, frequencies)
+        Logger.debug("The data update terminates normally")
+        return res
+    # ------------------------------------------------------
+    def _login(self, username: str, password: str) -> str:
+        session = Session()
+        session.headers.update({"domain": "grdf.fr"})
+        session.headers.update({"Content-Type": "application/json"})
+        session.headers.update({"X-Requested-With": "XMLHttpRequest"})
+        payload = SESSION_TOKEN_PAYLOAD.format(username, password)
+        response = session.post(SESSION_TOKEN_URL, data=payload)
+        if response.status_code != 200:
+            raise Exception(f"An error occurred while logging in. Status code: {response.status_code} - {response.text}")
+        session_token = response.json().get("sessionToken")
+        Logger.debug("Session token: %s", session_token)
+        jar = http.cookiejar.CookieJar()
+        session = Session()
+        session.headers.update({"Content-Type": "application/json"})
+        session.headers.update({"X-Requested-With": "XMLHttpRequest"})
+        params = json.loads(AUTH_TOKEN_PARAMS.format(session_token))
+        response = session.get(AUTH_TOKEN_URL, params=params, allow_redirects=True, cookies=jar)
+        if response.status_code != 200:
+            raise Exception(f"An error occurred while getting the auth token. Status code: {response.status_code} - {response.text}")
+        auth_token = session.cookies.get("auth_token", domain="monespace.grdf.fr")
+        return auth_token
+    @abstractmethod
+    def _loadFromSession(self, auth_token: str, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        pass
+# ------------------------------------------------------------------------------------------------------------
+class ExcelWebDataSource(WebDataSource):
+    DATA_URL = "https://monespace.grdf.fr/api/e-conso/pce/consommation/informatives/telecharger?dateDebut={0}&dateFin={1}&frequence={3}&pceList[]={2}"
+    DATE_FORMAT = "%Y-%m-%d"
+    FREQUENCY_VALUES = {
+        Frequency.HOURLY: "Horaire",
+        Frequency.DAILY: "Journalier",
+        Frequency.WEEKLY: "Hebdomadaire",
+        Frequency.MONTHLY: "Mensuel",
+        Frequency.YEARLY: "Journalier"
+    }
+    DATA_FILENAME = 'Donnees_informatives_*.xlsx'
+    # ------------------------------------------------------
+    def __init__(self, username: str, password: str, tmpDirectory: str):
+        super().__init__(username, password)
+        self.__tmpDirectory = tmpDirectory
+    # ------------------------------------------------------
+    def _loadFromSession(self, auth_token: str, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        res = {}
+        # XLSX is in the TMP directory
+        data_file_path_pattern = self.__tmpDirectory + '/' + ExcelWebDataSource.DATA_FILENAME
+        # We remove an eventual existing data file (from a previous run that has not deleted it).
+        file_list = glob.glob(data_file_path_pattern)
+        for filename in file_list:
+            if os.path.isfile(filename):
+                os.remove(filename)
+        if frequencies is None:
+            # Transform Enum in List.
+            frequencyList = [frequency for frequency in Frequency]
+        else:
+            # Get unique values.
+            frequencyList = set(frequencies)
+        for frequency in frequencyList:
+            # Inject parameters.
+            downloadUrl = ExcelWebDataSource.DATA_URL.format(startDate.strftime(ExcelWebDataSource.DATE_FORMAT), endDate.strftime(ExcelWebDataSource.DATE_FORMAT), pceIdentifier, ExcelWebDataSource.FREQUENCY_VALUES[frequency])
+            Logger.debug(f"Loading data of frequency {ExcelWebDataSource.FREQUENCY_VALUES[frequency]} from {startDate.strftime(ExcelWebDataSource.DATE_FORMAT)} to {endDate.strftime(ExcelWebDataSource.DATE_FORMAT)}")
+            # Retry mechanism.
+            retry = 10
+            while retry > 0:
+                # Create a session.
+                session = Session()
+                session.headers.update({"Host": "monespace.grdf.fr"})
+                session.headers.update({"Domain": "grdf.fr"})
+                session.headers.update({"X-Requested-With": "XMLHttpRequest"})
+                session.headers.update({"Accept": "application/json"})
+                session.cookies.set("auth_token", auth_token, domain="monespace.grdf.fr")
+                try:
+                    self.__downloadFile(session, downloadUrl, self.__tmpDirectory)
+                    break
+                except Exception as e:
+                    if retry == 1:
+                        raise e
+                    Logger.error("An error occurred while loading data. Retry in 3 seconds.")
+                    time.sleep(3)
+                    retry -= 1
+            # Load the XLSX file into the data structure
+            file_list = glob.glob(data_file_path_pattern)
+            if len(file_list) == 0:
+                Logger.warning(f"Not any data file has been found in '{self.__tmpDirectory}' directory")
+            for filename in file_list:
+                res[frequency.value] = ExcelParser.parse(filename, frequency if frequency != Frequency.YEARLY else Frequency.DAILY)
+                try:
+                    # openpyxl does not close the file properly.
+                    os.remove(filename)
+                except Exception:
+                    pass
+            # We compute yearly from daily data.
+            if frequency == Frequency.YEARLY:
+                res[frequency.value] = FrequencyConverter.computeYearly(res[frequency.value])
+        return res
+    # ------------------------------------------------------
+    def __downloadFile(self, session: Session, url: str, path: str):
+        response = session.get(url)
+        if "text/html" in response.headers.get("Content-Type"):
+            raise Exception("An error occurred while loading data. Please check your credentials.")
+        if response.status_code != 200:
+            raise Exception(f"An error occurred while loading data. Status code: {response.status_code} - {response.text}")
+        response.raise_for_status()
+        filename = response.headers["Content-Disposition"].split("filename=")[1]
+        open(f"{path}/{filename}", "wb").write(response.content)
+# ------------------------------------------------------------------------------------------------------------
+class ExcelFileDataSource(IDataSource):
+    def __init__(self, excelFile: str):
+        self.__excelFile = excelFile
+    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        res = {}
+        if frequencies is None:
+            # Transform Enum in List.
+            frequencyList = [frequency for frequency in Frequency]
+        else:
+            # Get unique values.
+            frequencyList = set(frequencies)
+        for frequency in frequencyList:
+            if frequency != Frequency.YEARLY:
+                res[frequency.value] = ExcelParser.parse(self.__excelFile, frequency)
+            else:
+                daily = ExcelParser.parse(self.__excelFile, Frequency.DAILY)
+                res[frequency.value] = FrequencyConverter.computeYearly(daily)
+        return res
+# ------------------------------------------------------------------------------------------------------------
+class JsonWebDataSource(WebDataSource):
+    DATA_URL = "https://monespace.grdf.fr/api/e-conso/pce/consommation/informatives?dateDebut={0}&dateFin={1}&pceList[]={2}"
+    TEMPERATURES_URL = "https://monespace.grdf.fr/api/e-conso/pce/{0}/meteo?dateFinPeriode={1}&nbJours={2}"
+    INPUT_DATE_FORMAT = "%Y-%m-%d"
+    OUTPUT_DATE_FORMAT = "%d/%m/%Y"
+    def __init__(self, username: str, password: str):
+        super().__init__(username, password)
+    def _loadFromSession(self, auth_token: str, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        res = {}
+        computeByFrequency = {
+            Frequency.HOURLY: FrequencyConverter.computeHourly,
+            Frequency.DAILY: FrequencyConverter.computeDaily,
+            Frequency.WEEKLY: FrequencyConverter.computeWeekly,
+            Frequency.MONTHLY: FrequencyConverter.computeMonthly,
+            Frequency.YEARLY: FrequencyConverter.computeYearly
+        }
+        # Data URL: Inject parameters.
+        downloadUrl = JsonWebDataSource.DATA_URL.format(startDate.strftime(JsonWebDataSource.INPUT_DATE_FORMAT), endDate.strftime(JsonWebDataSource.INPUT_DATE_FORMAT), pceIdentifier)
+        # Retry mechanism.
+        retry = 10
+        while retry > 0:
+            # Create a session.
+            session = Session()
+            session.headers.update({"Host": "monespace.grdf.fr"})
+            session.headers.update({"Domain": "grdf.fr"})
+            session.headers.update({"X-Requested-With": "XMLHttpRequest"})
+            session.headers.update({"Accept": "application/json"})
+            session.cookies.set("auth_token", auth_token, domain="monespace.grdf.fr")
+            try:
+                response = session.get(downloadUrl)
+                if "text/html" in response.headers.get("Content-Type"):
+                    raise Exception("An error occurred while loading data. Please check your credentials.")
+                if response.status_code != 200:
+                    raise Exception(f"An error occurred while loading data. Status code: {response.status_code} - {response.text}")
+                break
+            except Exception as e:
+                if retry == 1:
+                    raise e
+                Logger.error("An error occurred while loading data. Retry in 3 seconds.")
+                time.sleep(3)
+                retry -= 1
+        data = response.text
+        # Temperatures URL: Inject parameters.
+        endDate = date.today() - timedelta(days=1) if endDate >= date.today() else endDate
+        days = min((endDate - startDate).days, 730)
+        temperaturesUrl = JsonWebDataSource.TEMPERATURES_URL.format(pceIdentifier, endDate.strftime(JsonWebDataSource.INPUT_DATE_FORMAT), days)
+        # Get weather data.
+        temperatures = session.get(temperaturesUrl).text
+        # Transform all the data into the target structure.
+        daily = JsonParser.parse(data, temperatures, pceIdentifier)
+        if frequencies is None:
+            # Transform Enum in List.
+            frequencyList = [frequency for frequency in Frequency]
+        else:
+            # Get unique values.
+            frequencyList = set(frequencies)
+        for frequency in frequencyList:
+            res[frequency.value] = computeByFrequency[frequency](daily)
+        return res
+# ------------------------------------------------------------------------------------------------------------
+class JsonFileDataSource(IDataSource):
+    def __init__(self, consumptionJsonFile: str, temperatureJsonFile):
+        self.__consumptionJsonFile = consumptionJsonFile
+        self.__temperatureJsonFile = temperatureJsonFile
+    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        res = {}
+        with open(self.__consumptionJsonFile) as consumptionJsonFile:
+            with open(self.__temperatureJsonFile) as temperatureJsonFile:
+                daily = JsonParser.parse(consumptionJsonFile.read(), temperatureJsonFile.read(), pceIdentifier)
+        computeByFrequency = {
+            Frequency.HOURLY: FrequencyConverter.computeHourly,
+            Frequency.DAILY: FrequencyConverter.computeDaily,
+            Frequency.WEEKLY: FrequencyConverter.computeWeekly,
+            Frequency.MONTHLY: FrequencyConverter.computeMonthly,
+            Frequency.YEARLY: FrequencyConverter.computeYearly
+        }
+        if frequencies is None:
+            # Transform Enum in List.
+            frequencyList = [frequency for frequency in Frequency]
+        else:
+            # Get unique values.
+            frequencyList = set(frequencies)
+        for frequency in frequencyList:
+            res[frequency.value] = computeByFrequency[frequency](daily)
+        return res
+# ------------------------------------------------------------------------------------------------------------
+class TestDataSource(IDataSource):
+    def __init__(self):
+        pass
+    def load(self, pceIdentifier: str, startDate: date, endDate: date, frequencies: Optional[List[Frequency]] = None) -> MeterReadingsByFrequency:
+        res = {}
+        dataSampleFilenameByFrequency = {
+            Frequency.HOURLY: "hourly_data_sample.json",
+            Frequency.DAILY: "daily_data_sample.json",
+            Frequency.WEEKLY: "weekly_data_sample.json",
+            Frequency.MONTHLY: "monthly_data_sample.json",
+            Frequency.YEARLY: "yearly_data_sample.json"
+        }
+        if frequencies is None:
+            # Transform Enum in List.
+            frequencyList = [frequency for frequency in Frequency]
+        else:
+            # Get unique values.
+            frequencyList = set(frequencies)
+        for frequency in frequencyList:
+            dataSampleFilename = f"{os.path.dirname(os.path.abspath(__file__))}/resources/{dataSampleFilenameByFrequency[frequency]}"
+            with open(dataSampleFilename) as jsonFile:
+                res[frequency.value] = cast(List[Dict[PropertyName, Any]], json.load(jsonFile))
+        return res
+# ------------------------------------------------------------------------------------------------------------
+class FrequencyConverter:
+    MONTHS = [
+        "Janvier",
+        "Février",
+        "Mars",
+        "Avril",
+        "Mai",
+        "Juin",
+        "Juillet",
+        "Août",
+        "Septembre",
+        "Octobre",
+        "Novembre",
+        "Décembre"
+    ]
+    # ------------------------------------------------------
+    @staticmethod
+    def computeHourly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+        return []
+    # ------------------------------------------------------
+    @staticmethod
+    def computeDaily(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+        return daily
+    # ------------------------------------------------------
+    @staticmethod
+    def computeWeekly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+        df = pd.DataFrame(daily)
+        # Trimming head and trailing spaces and convert to datetime.
+        df["date_time"] = pd.to_datetime(df["time_period"].str.strip(), format=JsonWebDataSource.OUTPUT_DATE_FORMAT)
+        # Get the first day of week.
+        df["first_day_of_week"] = pd.to_datetime(df["date_time"].dt.strftime("%W %Y 1"), format="%W %Y %w")
+        # Get the last day of week.
+        df["last_day_of_week"] = pd.to_datetime(df["date_time"].dt.strftime("%W %Y 0"), format="%W %Y %w")
+        # Reformat the time period.
+        df["time_period"] = "Du " + df["first_day_of_week"].dt.strftime(JsonWebDataSource.OUTPUT_DATE_FORMAT).astype(str) + " au " + df["last_day_of_week"].dt.strftime(JsonWebDataSource.OUTPUT_DATE_FORMAT).astype(str)
+        # Aggregate rows by month_year.
+        df = df[["first_day_of_week", "time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]].groupby("time_period").agg(first_day_of_week=('first_day_of_week', 'min'), start_index_m3=('start_index_m3', 'min'), end_index_m3=('end_index_m3', 'max'), volume_m3=('volume_m3', 'sum'), energy_kwh=('energy_kwh', 'sum'), timestamp=('timestamp', 'min'), count=('energy_kwh', 'count')).reset_index()
+        # Sort rows by month ascending.
+        df = df.sort_values(by=['first_day_of_week'])
+        # Select rows where we have a full week (7 days) except for the current week.
+        df = pd.concat([df[(df["count"] >= 7)], df.tail(1)[df["count"] < 7]])
+        # Select target columns.
+        df = df[["time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]]
+        res = cast(List[Dict[str, Any]], df.to_dict('records'))
+        return res
+    # ------------------------------------------------------
+    @staticmethod
+    def computeMonthly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+        df = pd.DataFrame(daily)
+        # Trimming head and trailing spaces and convert to datetime.
+        df["date_time"] = pd.to_datetime(df["time_period"].str.strip(), format=JsonWebDataSource.OUTPUT_DATE_FORMAT)
+        # Get the corresponding month-year.
+        df["month_year"] = df["date_time"].apply(lambda x: FrequencyConverter.MONTHS[x.month - 1]).astype(str) + " " + df["date_time"].dt.strftime("%Y").astype(str)
+        # Aggregate rows by month_year.
+        df = df[["date_time", "month_year", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]].groupby("month_year").agg(first_day_of_month=('date_time', 'min'), start_index_m3=('start_index_m3', 'min'), end_index_m3=('end_index_m3', 'max'), volume_m3=('volume_m3', 'sum'), energy_kwh=('energy_kwh', 'sum'), timestamp=('timestamp', 'min'), count=('energy_kwh', 'count')).reset_index()
+        # Sort rows by month ascending.
+        df = df.sort_values(by=['first_day_of_month'])
+        # Select rows where we have a full month (more than 27 days) except for the current month.
+        df = pd.concat([df[(df["count"] >= 28)], df.tail(1)[df["count"] < 28]])
+        # Rename columns for their target names.
+        df = df.rename(columns={"month_year": "time_period"})
+        # Select target columns.
+        df = df[["time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]]
+        res = cast(List[Dict[str, Any]], df.to_dict('records'))
+        return res
+    # ------------------------------------------------------
+    @staticmethod
+    def computeYearly(daily: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
+        df = pd.DataFrame(daily)
+        # Trimming head and trailing spaces and convert to datetime.
+        df["date_time"] = pd.to_datetime(df["time_period"].str.strip(), format=JsonWebDataSource.OUTPUT_DATE_FORMAT)
+        # Get the corresponding year.
+        df["year"] = df["date_time"].dt.strftime("%Y")
+        # Aggregate rows by month_year.
+        df = df[["year", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]].groupby("year").agg(start_index_m3=('start_index_m3', 'min'), end_index_m3=('end_index_m3', 'max'), volume_m3=('volume_m3', 'sum'), energy_kwh=('energy_kwh', 'sum'), timestamp=('timestamp', 'min'), count=('energy_kwh', 'count')).reset_index()
+        # Sort rows by month ascending.
+        df = df.sort_values(by=['year'])
+        # Select rows where we have almost a full year (more than 360) except for the current year.
+        df = pd.concat([df[(df["count"] >= 360)], df.tail(1)[df["count"] < 360]])
+        # Rename columns for their target names.
+        df = df.rename(columns={"year": "time_period"})
+        # Select target columns.
+        df = df[["time_period", "start_index_m3", "end_index_m3", "volume_m3", "energy_kwh", "timestamp"]]
+        res = cast(List[Dict[str, Any]], df.to_dict('records'))
+        return res

pygazpar 1.2.8__py311-none-any.whl → 1.3.0a6__py311-none-any.whl

pygazpar 1.2.8py311-none-any.whl → 1.3.0a6py311-none-any.whl